• 



® REPUBLIQUE FRANQAISE 

INSTITUT NATIONAL 
DE LA PROPRIETE INDUSTRIELLE 



PARIS 



© N° de publication : 

(a n'utiliser que pour les 
commandes de reproduction) 

(2j) N° d'enregistrement national : 



2 823 218 
01 04599 



(fj) IntCI 7 : C 12 N 7/00, C 12 N 15/40, 15/85, 5/10, C 07 K 14/18 
16/10, C 12 Q 1/68, 1/70, G 01 N 33/569 



@ DEMANDE DE BREVET D'INVENTION A1 



(§) Date de depot : 04.04.01 . 


@ Demandeur(s) : INSTITUT PASTEUR — FR. 


@) Priorite : 




© Date de rnise a la disposition du public de la 
demande : 1 1 .1 0.02 Bulletin 02/41 . 

(5^) Liste des documents cites dans le rapport de 
recherche preliminaire : Se reporter a la fin du 
present fascicule 


(§) Inventeur(s) : DESPRES PHILIPPE, DEUBEL 

VINCENT, GUENET JEAN LOUIS, DROUET MARIE 
THERESE, MALKINSON MERTYN, BANET 
CAROLINE, FRENKIEL MARIE PASCALE, COURA- 
GEOT MARIE PIERRE, COULIBALY FASSELI, CAT- 
TEAU ADELINE, FLAMAND MARIE, WEBER PATRICK 
et CECCALDI PIERRE EMMANUEL 


@) References a d'autres documents nationaux 
apparentes : - 


©Titulaire(s): 

@ Mandataire(s) : CABINET ORES. 



@) SOUCHE NEUROViRULENTE DU VIRUS WEST NILE ET SES APPLICATIONS. 



Souche neuroinvasive et neurovlrulente du virus West 
Nile, denommee IS-98-ST1 , molecules d'acide nucleique is- 
sues de son genome, proteines et peptides codes par lesdi- 
tes molecules d'acide nucleique ainsi que leurs 
applications. 




2823218 

i 

SOUCHE NEUROVTRULENTE DU VIRUS WEST NILE 
ET SES APPLICATIONS 
La presente invention est relative a une souche neuroinvasive et 
neurovirulente du virus West Nile, denommee IS-98-ST1, a des molecules d'acide 
5 nucleique issues de son genome, aux proteines et peptides codes par lesdites 
molecules d'acide nucleique ainsi qu'a leurs applications. 

La presente invention conceme egalement tous variants de la souche 
virale IS-98-ST1 ayant au moins une mutation dans la sequence nucleique corres- 
pondant a NS5. 

10 La famille des Flaviviridae regroupe les virus du genre flavivirus 

responsables de pathologies humaines graves telles que la dengue, la fievre jaune, les 
encephalites transmises par les tiques, l'encephalite japonaise, l'encephalite a West 
Nile et les virus des hepatites C et G. Si les flavivirus sont susceptibles de provoquer 
une morbidite et une mortalite importantes chez l'homme, Tinfection est generalement 

15 asymptomatique et seule une fraction des individus infectes developpent une maladie 
grave. 

Les flavivirus sont des petits virus enveloppes. Leur genome est une 
molecule d'ARN monocatenaire de polarite positive d'environ 1 1 000 bases. L'ARN 
genomique est associe a plusieurs copies de la proteine de capside C pour former la 

20 nucleocapside; elle est entouree d'une enveloppe virale constitute d'une double couche 
lipidique issue des membranes du reticulum endoplasmique (RE) dans lesquelles sont 
ancrees la proteine d'enveloppe E et la proteine de membrane M. L'ARN genomique 
des flavivirus contient un unique cadre de lecture ouvert d'environ 10500 nucleotides 
flanque de deux courtes regions non codantes a ses extrernites 5' et 3'. Le genome est 

25 traduit en une polyproteine d'environ 3400 acides amines qui est le precurseur des 
proteines structurales C, prM (le precurseur intracellulaire de M) et E dans sa partie N- 
terminale et d'au moins sept proteines non structurales (NS) de NS1 a NS5 dans sa 
partie C-terminale. 

Jusque tres recemment, le virus West Nile etait reconnu comme un 

30 virus peu pathogene, responsable d'un syndrome grippal et present en Afrique, en 
Europe du Sud et au Moyen Orient ; il a ete isole au cours d'epidemies, survenues 
notamment en Israel dans les annees 1950 et en Afrique du Sud dans les annees 1970. 
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Tres recemment, i'epidemiologie du virus West Nile s'est modifiee 
et un nombre croissant de cas d'encephalites a ete observe aux cours des epidemies 
survenues en Roumanie en 1996, en Israel en 1998 et aux USA en 1999. 

Des souches pathogenes ont ete isolees lors de ces epidemies, en 
5 particulier la souche NY 1999 (GenBank n°AF202541), dont la pathogenicity serait 
correlee a la presence d'un site de glycosylation NTS dans la proteine d'enveloppe E 
(Jordan et ah, Viral Immunol., 2000, 13, 4, 435-446). 

Des facteurs viraux mal identifies pourraient etre responsables de la 
gravite de V infection, alors que la constitution genetique de Thote (humain ou non- 
10 humain) contribuerait a la resistance a Tinfection. 

Toutefois, les donnees relatives a ces souches pathogenes recemment 
isolees n'ont pas permis de determiner tous les facteurs viraux et les genes de Thote 
impliques dans la sensibilite/resistance a Tinfection par les Flaviviridae. 

Des modeles murins ont permis d'etablir l'existence d'une resistance 
15 genetique a F infection par les flavivirus. II a ete montre que certaines lignees de souris 
recemment derivees de Petat sauvage et appartenant aux especes Mus musculus 
musculus ou Mus spretus (Det, BSVR, BRVR, PRI, CASA/Rk et CAST/Ei) sont 
resistantes a Tinfection par les flavivirus, alors que les lignees consanguines de 
laboratoire les plus courantes qui derivent majoritairement de Tespece Mus musculus 
20 domesticus , n*y resistent pas (Sangster et al, J. Virol., 1993, 67 : 340-347). 

La resistance est controlee par au moins un locus autosomal 
denomme FIv, localise sur le chromosome 5, chez la souris et trois alleles Flv 1 , FIV et 
Fl\T r conftrent respectivement la sensibilite, la resistance et la resistance intermediaire 
a Tinfection par les flavivirus. En utilisant une souche du flavivirus de Tencephalite de 
25 la Vallee de Murray et des souris issues du croisement retour de la lignee de, souris 
resistante C3H/RV avec les lignees de souris sensibles C3/He ou BALB/c, le locus FIv 
a ete localise dans une region de 0,9 cM du chromosome 5, chez la souris, entre les 
marqueurs D5MH68 et D5MU242 (G.R. Shellam et al., Rev. Sci. Tech. Off. Epiz, 
1998,17:231-248.). 

30 Les Inventeurs ont maintenant isole une nouvelle souche du virus 

West Nile, a partir d'echantillons preleves sur des cigognes en Israel (dans la ville 
d'Eilat) en septembre 1998, qui a ete selectionnee pour Tetude de la resis- 
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tance/sensibilite d'un hote (mammifere humain ou non-humain) a l'infection par les 
virus de la famille des Flaviviridae. 

Conformement a I'invention, ladite souche neurovirulente et 
neuro invasive du virus West Nile isolee, denommee IS-98-ST1, est caracterisee en ce 
5 que son genome est constitue par la sequence SEQ ID NO : 1. 

Les Inventeurs ont notamment montre que les souris de laboratoire 
sont extremement sensibles a l'infection par la souche IS-98-ST1 alors que les souris 
des lignees SEG, WMP, STF et MAI qui derivent de souris sauvages appartenant a 
des especes differentes bien que du meme genre Mus, sont completement resistantes a 
10 Tinfection par cette souche; une inoculation par voie intraperitoneale de 100 UFF 
(Unites Formant Foyer; UFF:DL50 = 10) est mortelle a 100 % pour les souris de 
laboratoire, alors que les souris sauvages ne presentent aucun symptome ; en outre, le 
virus se replique chez ces souris, comme le montre Fapparition d'anticorps seriques 
specifiques. 

15 La presente invention a egalement pour objet des reactifs, derives de 

la souche IS-98-ST1, utilises pour Tetude et le diagnostic des infections par les Flavi- 
viridae, lesquels reactifs sont selectionnes dans le groupe constitue par les reactifs 
suivants : 

(a) une molecule d'acide nucleique choisie parmi la sequence SEQ 
20 ID NO :1, les fragments d'au moins 15 nucleotides de la sequence SEQ ID NO : 1 et 

les sequences cornplementaires sens et anti-sens des sequences precedentes. 

(b) un vecteur recombinant comprenant une molecule d'acide 
nucleique telle que definie en (a), 

(c) une cellule transformee par une molecule d'acide nucleique telle 
25 que definie en (a), un vecteur tel que defini.en (b) ou une souche neurovirulente du 

virus West Nile telle que definie en (a), 

(d) une proteine ou un peptide code par une molecule d'acide 
nucleique telle que definie en (a), 

(e) un anticorps polyclonal, susceptible d'etre obtenu par immunisa- 
30 tion d'un mammifere non-humain avec la souche IS-98-ST1 du virus West Nile telle 

que definie ci-dessus ; de maniere preferee, ledit mammifere non-humain est une 
souris homozygote pour Fallelei 7 //, resistante a Tinfection par les Flaviviridae, et 
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(f) un anticorps polyclonal ou monoclonal, susceptible d'etre obtenu 
par immunisation d'un mammifere non-humain avec un vecteur recombinant tel que 
defini en (b) ou bien une proteine ou un peptide, tels que definis en (d). 

Ces differents reactifs sont prepares et utilises selon les techniques 
5 classiques de biologie moleculaire et d'immunologie, en suivant les protocoles 
standards tels que ceux decrits dans Current Protocols in Molecular Biology 
(Frederick M. AUSUBEL, 2000, Wiley and son Inc, Library of Congress, USA) et 
dans Current Protocols in Immunology (John E. Coligan, 2000, Wiley and Son Inc. 
Library of Congress, USA). 

.10 Les fragments d'acides nucleiques tels que definis ci-dessus sont 

utilises par exemple comme sonde ou comme amorce pour le diagnostic d'une 
infection par le virus West Nile ; Pinfection est detectee par exemple par PCR et/ou 
par hybridation, a partir des acides nucleiques extraits d'un echantillon biologique 
preleve chez un individu susceptible d'etre infecte ou un animal de laboratoire inocule 

15 par ledit virus. 

Selon un mode de realisation avantageux desdits fragments, ils 
comprennent au moins 15 nucleotides de la SEQ ID NO: I en amont ou en aval de Tun 
des codons en position suivante : 

- codon Ala (A) en position 5 1 de la proteine E, 

20 - codon Asp (N) en position 1 7 de la proteine NS 1 , 

- codon Arg (R) en position 164 de la proteine NS2A, 

- codons Gly (G) en position 82 et Glu (E) en position 83 de la 
proteine NS2B, 

- codons Pro (P) en position 496 et Glu (E) en position 521 de la 
25 proteine NS3, et 

- codons Ser (S) en position 54, Asp (N) en position 280 et Ala 
(A) en position 372 de NS5. 

De tels fragments sont utiles comme amorces pour amplifier, des 
fragments contenant lesdits codons. 
30 De maniere preferee, lesdits fragments sont situes entre 10 et 100 

nucleotides en amont ou en aval desdits codons. 
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Selon un autre mode de realisation avantageux desdits fragments, ils 
sont constitues par les fragments comprenant les codons precites et comprennent de 
preference entre 50 et 200 nucleotides. 

Les vecteurs recombinants tels que definis ci-dessus, en particulier 
5 les vecteurs d'expression et les cellules transformees par lesdits vecteurs d'expression 
sont avantageusement utilises pour la production des proteines et des peptides corres- 
pondants. 

Lesdites proteines et lesdits peptides, qui sont aptes a etre reconnus 
et/ou a induire la production d'anticorps specifiques du virus West Nile, en particulier 
10 de souches neurovirulentes, sont utiles pour le diagnostic d'une infection par un virus 
West Nile ; l'infection est detectee par une technique appropriee, notamment EIA, 
ELISA, RIA, immunofluorescence a partir d'un echantillon biologique preleve chez 
un individu susceptible d'etre infecte ou un animal de laboratoire inocule par ledit 
virus. Les proteines et les peptides tels que definis ci-dessus sont egalement utilises 

15 pour la recherche de partenaires cellulaires de ces proteines virales susceptibles d'etre 
impliques dans la pathogenicite (neurovirulence) du virus West Nile ; ces partenaires 
sont identifies par des techniques d'immunoaffinite, par exemple par chromatographic 
sur colonne d'immunoaffinite. 

Les anticorps selon l'invention sont utiles pour le diagnostic d'une 

20 infection par un virus West Nile en particulier des souches neurovirulentes ; 
Tinfection est detectee par une technique appropriee, notamment EIA, ELISA, RIA, 
immunofluorescence a partir d'un echantillon biologique preleve chez un individu 
susceptible d'etre infecte ou un animal de laboratoire inocule par ledit virus. Parmi 
ceux-ci, les anticorps produits par immunisation de souris FW/FW avec la souche IS- 

25 98-ST1 possedent avantageusement un titre eleve et une tres grande specificite pour le 
virus West Nile. 

Les cellules transformees selon l'invention, en particulier les cellules 
neurales (neurones et cellules endothelials) infectees par une souche neurovirulente 
telle que definie ci-dessus, sont utilisees pour identifier les genes issus de ces cellules 
30 dont l'expression pourrait etre modulee au cours de Tinfection virale ; ces genes sont 
detectes par exemple par la technologie des biopuces, selon les protocoles classiques 



2823218 

6 

tels que decrits dans « Atlas Mouse Arrays (#membranes) ATLAS™ NYLON cDNA 
EXPRESSION ARRAYS (CLONTECH, USA). 

La presente invention a egalement pour objet un rnodele d 'etude de 
la sensibiiite/resistance a 1'infection par un virus de la famille des Flaviviridae, carac- 
5 terise en ce qu'il comprend au moins une souche neurovirulente du virus West Nile 
telle que definie ci-dessus. 

Selon un mode de realisation avantageux dudit modele, il comprend 
en outre une souris homozygote pour l'allele FIV ou FIV. 

La presente invention a egalement pour objet un procede de detec- 
10 tion d'une infection a Flaviviridae, notamment du virus West Nile, caracterise en ce 
qu'il comprend : 

- T amplification des ARN issus d'un echantillon biologique a tester 
a 1'aide des amorces telles que definies ci-dessus, et 

- le sequen9age du produit d 'amplification obtenu. 

15 Une telle detection peut avantageusement permettre le pronostic de 

la severite d'une encephalite virale a virus West Nile. 

La souche neurovirulente du virus West Nile selon l'invention est 
utilisee pour le criblage de genes cellulaires impliques dans la resistance d'un mammi- 
fere a Tinfection par un virus de la famille des Flaviviridae, de preference le virus de 

20 1' hepatite C. 

De maniere avantageuse, ledit procede de criblage comprend les 

etapes suivantes : 

- mise en culture de cellules derivees d'un hote (humain ou non- 
humain) selectionne pour sa resistance ou sa sensibilite a I'infection par un Flavivi- 

25 ridae, 

- infection in vitro desdites cellules par un Flaviviridae, et 

- detection de genes exprimes de maniere differentielle dans lesdites 

cellules infectees. 

Conformement a l'invention, ladite detection peut comprendre 
30 l'etablissement du profil de transcrits ou de proteines a partir desdites cellules. 
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La presente invention a egalement pour objet I 'utilisation du modele 
tel que defini ci-dessus pour le tri de molecules actives contre une infection virale due 
a un virus de la famille des Flaviviridae. 

La presente invention a en outre pour objet un procede de tri de 
5 molecules actives contre une infection par un Flavivirus , caracterise par : 

- la mise en contact d'une culture de cellules eucaryotes, issues d'un 
mammifere (humain ou non-humain) sensible a l'infection a un Flaviviridae avec une 
suspension virale de la souche selon la revendication 1, en presence ou en F absence de 
la molecule a tester et 

10 - detection de F amplification/replication du virus, par toute methode 

connue (quantification genome, ARNm, proteines, particules virales). 

Outre les dispositions qui precedent, Finvention comprend encore 
d'autres dispositions, qui ressortiront de la description qui va suivre, qui se refere a 
des exemples de mise en ceuvre de F objet de la presente invention, ave references aux 

15 dessins annexes dans lesquels : 

- les figures 1A a IE represented la comparaison de la sequence en 
acides amines des proteines virales de la souche IS-98-ST1 et de la souche New York 
(NY99 ; Genbank AF1 96835) isolee lors de Fepidemie de 1999 aux Etats-Unis, 

- la figure 2 represente la cinetique de mortalite et la cinetique 
20 d'apparition des anticorps seriques specifiques chez des souris sensibles F/vVF/v* 

(BALB/c), infectees par la souche IS-98-ST1 du virus West Nile, 

- la figure 3 represente la cinetique de propagation de la souche IS- 
98-ST1 dans le systeme nerveux central des souris sensibles Flv*/Flv s (BALB/c), 

- les figures 4 (A, B et C) represented la cinetique d'apparition des 
25 antigenes viraux dans les cellules Neuro 2a et les neurones primaires de souris 

sensibles (BALB/c) infectees par le virus West Nile (souche IS-98-ST1), 

- la figure 5 represente la mort par necrose des cellules Neuro 2a 
infectees par le virus West Nile (souche IS-98-ST1), 

- la figure 6 represente le protocole experimental utilise pour preci- 
30 ser la localisation du locus Flv sur le chromosome 5 de la souris, 

- la figure 7 represente la carte genetique du locus Flv, determinee a 
partir de souris sensibles, issues du premier croisement en retour entre les lignees 
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resistantes (MAJ/Pas et MBT/Pas) et les lignees sensibles (C57BL/6 ou BALB/c). Les 
boites blanches represented les alleles BALB/c ou C57B1/6 et les boites noires repre- 
sented les alleles MAI/Pas ou MBT/Pas. 

- la figure 8 represente la carte genetique du locus Fiv determinee a 
5 partir des souris resistantes et sensibles, issues du premier croisement en retour (BC1) 

entre les lignees resistantes (MAI/Pas et MBT/Pas) et les lignees sensibles (C57BL/6 
et BALB/c). Les lignes grisees represented les alleles (BALB/c ou C57BI/6) et les 
lignes noires represented les alleles MAI/Pas ou MBT/Pas, 

- Ia figure 9 represente la carte genetique et la carte physique du 
10 locus Fiv et la position du gene OAS dans ce locus, et 

- la figure 10 represente la distribution des alleles Fiv chez les souris 
resistantes et sensibles issues du premier croisement en retour (BC1) entre les lignees 
resistantes (MAI/Pas et MBT/Pas) et les lignees sensibles (C57BL/6 et BALB/c). 
Exemple 1 : Isolement, amplification, purification et titration de la souche 

15 neuroinvasive du virus West Nile IS-98-ST1 

Un isolat du virus West Nile (WN) a ete obtenu a partir du systeme 

nerveux central d'une cigogne manifestant des troubles neuropathologiques severes, en 

septembre 1998, a Eilat (Israel). L'infection de cellules VERO par cet isolat est cyto- 

lytique et l'immunofluorescence indirecte avec un ascite de souris immun specifique 
20 du virus West Nile (souche de reference WN 8907) est positive a 100 %. Le virus 

produit sur cellules VERO a ete recolte et amplifie sur cellules de moustiques AP61 

(Despres et ah, Virol., 1993, 196, 209-219) . 

Le Passage 1 (ou PI) du virus WN sur cellules AP61 a ete recolte 3 

jours apres l'infection ; il possede un titre de 2,5 x 10 8 UFF/ml (Unite Formant Foyer) 
25 par la technique de titration sur cellules AP61 decrite dans Despres et al (precite). 

L'inoculum PI du virus WN sur cellules AP61 a ete identifie comme la souche IS-98- 

ST1. 

Un P2 a ete obtenu a partir de cellules AP61 infectees par la souche 
IS-98-ST1, PI (titre: 6 x 10 7 UFF/ml). L'inoculum P2 de IS-98-ST1 est utilise pour les 
30 epreuves de sensibilite a l'infection virale chez des souris adultes. 

Un inoculum viral P3 de la souche IS-98-ST1 avec un titre de 5 x 
10 7 UFF/ml a ete produit sur cellules AP61. Une preparation virale hautement puri- 
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fiee, preparee selon le protocole de purification des flavivirions decrit dans Despres et 
aL, 1993) a ete obtenue a partir de 20 boites de 150 cm 2 de cellules AP61 recoltees 3 
jours apres Finfection par l'inoculum P3 du virus WN souche IS-98-ST1 (multiplicity 
defection de 0,4). La souche IS-98-ST1 purifiee en gradients de saccharose a un titre 
5 final de 2 x 10 10 UFF/ml. Les ARN extraits de ce virus purifie sont utilises pour 
amplifier les ADNc correspondant aux proteines virales C, prM et NS1 ou aux 
sequences non codantes aux extremites 5' et 3' du genome viral. 
Exemple 2 : Sequen^age du genome de la souche neuroinvasive IS-98-ST1 

Le genome viral a ete extrait a partir du surnageant de culture des 
10 cellules VERO infectees de l'exemple 1 a I'aide du kit " QIAamp Viral RNA " 
(QIAGEN), en suivant les instructions du fabricant. 6 produits RT-PCR chevauchants 
ont ete amplifies a partir de ces ARNs en utilisant les amorces decrites par Lanciotti et 
aL (Science, 199, 286 :2333-). Les extremites 5' et 3' du genome viral ont ete ampli- 
fies a Paide d 1 amorces synthetisees d'apres la sequence de la souche WN-NY99 
15 (Genbank n° AF202541). Les ADNc obtenus ont ete purifies par chromatographic 
echangeuse d'ions et precipites dans 2 volumes d'isopropanol. Ensuite les ADNc ont 
ete sequences sur les deux brins en utilisant le kit " Taq Dye Deoxy Terminator Cycle 
Sequencing " (PERKIN ELMER CORP./APPLIED BIOSYSTEM) et les amorces 
espacees de 400 paires de bases sur le genome viral (Lanciotti et aL, precite). Le 
20 sequencage a ete realise avec 0,2 pmoles d'ADNc purifie et 30 pmoles d'amorces, en 
suivant le protocole recommande par le fabricant. L'alignement des sequences est 
realise a I'aide du logiciel CLUSTAL W. 

La sequence genomique complete de la souche IS-98-ST1 du virus 
West Nile correspond a la sequence SEQ ID NO : 1. 
25 L'alignement des sequences en acides amines de la souche IS-98- 

ST1 et de la souche NY99, presentee a la figure 1, montre que la souche IS-98-ST1 
isolee en Israel en 1998 et la souche NY-99 isolee a New York en 1999 sont tres 
proches (divergence de moins de 0,2% au niveau des sequences en acides amines). 

Cependant, les differences observees dans la souche IS-98-ST1, 
30 respectivement dans les proteines E (A 51 ), NS1 (N l7 ), NS2A (R 164 ), NS2B (G 82 , E 83 ), 
NS3 (P 496 , E 521 ) et NS5 (S 54 , N 280 , A 372 ) sont potentiellement responsables de la neuro- 
virulence et des proprietes neuroinvasives observees avec cette souche et peuvent 



2823218 

10 

servir de marqueur de virulence du virus West Nile. 

Exemple 3 : Clonage des proteines de la souche neuroinvasive IS-98-ST1 et utili- 
sations des plasmides recombinants obtenus. 

1- La proteine C 

5 L'ARN genomique extrait des virions IS-98-ST1 purifies sur 

gradients de saccharose decrits a 1'exemple 1, a Taide de la solution RNA PLUS 2 
(Q.BIOGEN), est utilise comme matrice pour amplifier la sequence codant pour la 
proteine C (acides amines 1 a 123) par la technique RT-PCR (kit Titan One Tube RT- 
PCR; Roche Biochemicals #1939 823). 
10 Le couple d'amorces utilise sur la matrice ARN est le suivant : 

• 5'C/WNV (sequence des nt 82-1 18 du genome viral) 

5' TAG CAC GAA GAA TTC GAT GTC TAA GAA ACC AGG AGG G 3' (SEQ ID 
NO:3) qui contient le site de restriction EcoRl, et 

• 3'C/WNV (sequence anti-sens des nt 433 a 482 du genome viral) et 

15 5 ' AAGTTAGCCCGGGTTAATGCTCCTACGCTGGCGATCAGGCCAATC AGG AC 
3'(SEQ ID NO:4) qui contient le site de restriction Sma I. 

LADNc de la proteine C de la souche IS-98-ST1 (acides amines 1 a 
123) du virus WN a ete clone d'une part entre les sites EcoRl et Smal du plasmide 
pCI-neo (Promega # El 841) et d' autre part entre les sites Kspl et Smal du plasmide 
20 pIVEX 2.4a (Roche). 

Le plasmide recombine pCI-C/WN contient la sequence complete du 
gene de la proteine C de la souche IS-98-ST1 du virus WN entre les promoteurs T7 et 
T3. La transcription in vitro de pCI-CAVN linearise par Nhel sous la dependance du 
promoteur T3 synthetase un ARN d'environ 370 bases complementaire de la sequence 

25 virale genomique. La ribosonde marquee a la DIG (digoxigenine) est utilisee pour la 
detection des ARN viraux sens positif presents dans les cellules infectees par le virus 
WN, par la technique d'hybridation in situ, seion le protocole decrit dans Despres et 
al.XJ.Virol., 1998, 72 : 823-829). 

Le plasmide recombinant pIVEX-C/WN est utilise pour la produc- 

30 tion massive de la proteine C (acides amines 1 a 123) du virus WN en lysat bacterien 
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(systeme RTS 500 de Roche). La proteine recombinante C produite z>i v/7ro possede a 
son extremite N-terminale une sequence [His] 6 et le site de clivage reconnu par la 
protease Xa pour permertre d'une part sa purification sur colonne de Ni et d'autre part 
I'elimination des residus histidines. La proteine C de la souche IS-98-ST1 du virus 
5 WN ainsi produite est utilisee pour des etudes structurales, pour la recherche de parte- 
naires cellulaires de cette proteine en colonne d'immunoaffmite, et pour la production 
d'anticorps monospecifiques chez Ie lapin. 

2- La proteine M 

Les ADNc de la souche IS-98-ST1 du virus WN codant pour la 
10 proteine M (acides amines 215 a 290 de la polyproteine virale) ou son ectodomaine de 
41 acides amines (acides amines 215 a 255; acronyme ectoM) sont clones : 

(1) en phase avec Textremite C-terminale de TEGFP dans le 
plasmide p[95-l 14]EGFP, derive du plasmide pEGFP-Nl (Clontech) qui comprend 
les residus 95-1 14 de la proteine C du virus de la dengue de type 1 (souche BR/90) 

15 fusionnes en phase avec la sequence N-terminale de la proteine EGFP[21 5-290] WNV, 
pour dormer le plasmide p[95-l 14]EGFP[2 15-290] WNV, 

(2) dans le plasmide pIVEX (systeme RTS 500 de Roche) pour 
donner Ie plasmide pIVEX[EGFP][215-255]WNV, 

(3) dans le vecteur retroviral TRIPdeltaU3CMV, pour donner le 
20 plasmide TRJPdeltaU3CMV[95-l 14]EGFP[21 5-255]WNV. 

Le plasmide pIVEX[EGFP][2 15-255] WNV permet la synthese 
acellulo et la purification de la proteine chimerique EGT??-ectoM WNV qui est utilisee 
d'une part pour la production d'anticorps monospecifiques diriges contre la proteine M 
du virus WN et d'autre part pour la recherche de partenaires cellulaires de la molecule 

25 ectoM WNV en colonne d'immunoaffmite. 

Le plasmide TRIPdeltaU3CMV[95-l 14]EGFP[215-255]WNV est 
cotransfecte dans des cellules 293T avec les plasmides 8.7 et G-VSV pour produire 
des particules virales pseudotypees par l'enveloppe G du virus de stomatite vesiculate 
(VSV), contenant les proteines internes du virus de l'immunodeficience acquise (VIH) 

30 et des molecules d'ARN chimeriques CMV[95-1 14]EGFP[215-255]WNV. L'infection 
des cellules cibles par le vecteur recombine non replicatif permet Integration dans le 
genome cellulaire de l'ADN CMV[95-1 14]EGFP[2 15-255] WNV et l'expression stable 



+ 
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de Tectodomaine de la proteine M-WN sous le controle du promoteur CMV. 
3- La proteine NS1 

L'ADNc de la souche IS-98-ST1 du virus WN codant pour la glyco- 
proteine NS1 avec son peptide signal (acides amines 767 a 1143 de la polyproteine 
5 virale) est clone entre les sites BamH\ et Kpnl du vecteur retroviral TRIPdeltaU3 pour 
produire le plasmide recombine TRIPdeltaU3-CMV-NSl-WN. Le plasmide 
TRIPdeltaU3-CMV-NSl-WN est cotransfecte dans des cellules 293T avec les 
plasmides 8.7 et G-VSV pour produire des particules virales pseudotypees par l'enve- 
loppe G du virus de stomatite vesiculate (VSV), contenant les proteines internes du 

10 virus de rimmunodeficience acquise (VTH) et des molecules d'ARN chimeriques 
CMV-NS1-WN. L'infection des cellules cibles par le vecteur recombine non replicatif 
permet Integration dans le genome cellulaire de PADN CMV-NS1-WN et l'expres- 
sion stable de la proteine NS1 du virus WN sous le controle du promoteur CMV. La 
proteine NS1 de la souche IS-98-ST1 du virus WN ainsi produite est utilisee pour des 

15 etudes structurales, pour la recherche de partenaires cellulaires de cette proteine en 
colonne d'immunoaffinite, et pour la production d'anticorps monospecifiques chez le 
lapin. 

Exemple 4 : Les souris sauvages et de lignees consanguines de laboratoire se 
differencient par leur sensibilite a Tinfection par la souche neuroinvasive IS-98- 
20 ST1 du virus West Nile. 

1- Les lignees de souris et les cellules sensibles. 
a) lignees de souris sensibles 

Des souris de lignees consanguines sensibles Ftf (BALB/c) agees 
de 6 semaines sont inoculees par la voie mtraperitoneale avec 100 UFF de la souche 
25 IS-98-STI virus West Nile (UFF:DL50= 10), preparee comme decrit a Texemple 1. 

Ces souris meurent a 100% avec un temps moyen de mortalite de 9 
± 2 jours (Figure 2). 

La cinetique de propagation de la souche IS-98ST1 dans le systeme 
nerveux central de la souris sensible (BALB/c) a ete analysee a partir des extraits de 
30 cerveau des souris infectes litres sur cellules AP61, selon la technique decrite dans 
selon la technique decrite dans Despres et al. (/. Virol., 1998, 72, 823-829). Les 
resultats montrent que le virus est detecte dans le systeme nerveux central (SNC) 
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murin ail 5 eme jour de Tinfection et la production virale est maximale au l ime jour 
(Figure 3). Au 9*™ jour de 1'infection, le virus n'est plus detecte dans le SNC murin 
(Figure 3). . 

La replication du virus WN dans le SNC et les organes peripheriques 
5 des souris infectees par la souche IS-98-ST1 est egalement detectee par immuno- 
histologie, selon les protocoles classiques tels que decrits dans Despres et al., 1998 
(precite) et par hybridation in situ, selon les protocoles decrits a Texemple 3. 

Les anticorps seriques specifiquement diriges centre les proteines du 
virus WN sont titres par ELISA selon le protocole decrit dans Despres et al., 1993 
10 (precite), en utilisant la souche IS-98-ST1 purifie sur gradient de saccharose telle que 
decrite a Texemple 1, comme antigene. Les resultats montrent que les anticorps 
seriques apparaissent au 5* mc jour de 1'infection et sont significativement detectes au 
7* me jour (figure 2). 



homozygotes pour 1'allele Fl\f (souris Swiss, Janvier) sont prepares selon les proto- 
coles classiques. Les cellules sont infectees par la souche IS-98-ST1 a une multiplicite 
d'infection de 20 UFF par cellule (m.i. de 20). L'effet cytopathique est observe en 

20 microscopie optique, la production virale est analysee par titration sur cellules AP61 
comme decrit precedemment a l'exemple 1 et Texpression des antigenes viraux est 
analysee par radioimmunoprecipitation a l'aide d'un serum immun de souris anti-West 
Nile, selon les protocoles classiques tels que decrits dans Duarte Dos Santos et al. 
{Virology, 2000, 274, 292-308). 

25 Les resultats montrent que 80% des neurones en culture produisent 

les antigenes viraux : 



15 



b) cellules sensibles 
bl) cultures primates 

Des neurones primaires et des astrocytes du SNC de souris sensibles 



- leur profil en gel de polyacrylamide-SDS est presente a la figure 



4A. 



30 



- la production virale est de [3,0 ± 1,5] x 10 6 UFF/ml apres 20 h 
d'infection et de [7,0 ± 0,5] x 10 7 UFF/ml a 40 h. 

- les effets cytopathiques (ECPs) de type necrotique sont observes 
apres 48 h d'infection virale. 
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En revanche, les astrocytes du SNC murin ne sont pas permissifs a la 
replication du virus WN souche IS-98-STI . 

b 2 ) lignew.cejjulaires 

Des cellules de neuroblastome murin Neuro 2a et des cellules 
5 d'hepatome humain HepG2, cultivees dans les conditions classiques telles que decrites 
dans Marianneau et al. (/. Virol, 1996, 77, 2547-2554) sont infectees a differentes 
multiplicity defection par le virus WN souche IS-98-ST1, prepare comme decrit a 
Texemple 1. L'effet cytopathique est observe en microscopie optique, la production 
virale est analysee par titration sur cellules AP61 comme decrit precedemment a 
10 l'exemple 1 et Texpression des anti genes viraux est analysee par 
radioimmunoprecipitation a Taide d'un serum immun de souris anti-West Nile, selon 
les protocoles classiques tels que decrits dans Duarte Dos Santos et al., Virol., 2000, 
274,292-308. 

Les r6sultats montrent que les cellules de neuroblastome murin 
15 Neuro 2a sont permissives a la replication de la souche IS-98-ST1 du virus WN. Une 
m.i. de 4 est necessaire pour infecter 80% des cellules Neuro 2a en monocouche. La 
production virale est de 10 7 UFF/ml (m.i. de 4) apres 40 h d'infection et la mort 
cellulaire par necrose est massive (Figure 5). La cinetique de production des antigenes 
majeurs prM, E et NS1 a partir de la polyproteine virale presentee dans la figure 4B. 
20 montre que le demi-temps de formation de la glycoproteine d'enveloppe E est 
d'environ 30 min. La proteine E de la souche IS-98-ST1 semble ne posseder qu'un 
seul residu N-glycanne (figure 4C). 

Les resultats montrent egalernent que les cellules d'hepatome humain 
HepG2 sont permissives a la replication de la souche IS-98-ST1 du virus WN. A une 
25 m.i. de 10, la production virale est de [2 ± 1] x 10 6 UFF/ml apres 48 h d'infection et les 
ECPs sont observes a partir de 72 h. 

2- Les souris resistantes. 

Les lignees de souris resistantes (f/i/) qui derivent de souris 
sauvages de Pespece Mus spretus (SEG/Pas et STF/Pas), Mus musculus musculus 
30 (MBTYPas, MAI/pas), Mus musculus domesticus (WMP/Pas), sont inoculees par la 
voie intraperitoneale, avec 1000 UFF (100 DL50) de la souche IS-98-ST1 preparee 
selon le protocole decrit a Texemple 1. 



2823218 

15 

Contrairement aux souris de laboratoire qui sont sensibles a 
Tinfection par la souche IS-98-ST1 et meurent en une dizaine de jours, ces souris 
derivant de souris sauvages sont resistantes a Tinoculation de la souche IS-98-ST1 et 
neanmoins permissives a la replication de la souche IS-98-ST1. En effet, Tinfection 
5 virale des souris derivant de souris sauvages est asymptomatique bien que le virus se 
multiplie in toto comme le demontre la production d'anticorps seriques anti-WN a 
hauts titres ; en ELISA, les titres des serums a la dilution 1:100 pour 10 6 UFF de 
virion purifie IS-98-ST1 sont superieurs a 1 unite de D.O. a 450 nm. 

Les souris resistantes a Tinfection virale sont utilisees pour la pro- 
10 duction de serums immuns specifiquement diriges contre les proteines de la souche IS- 
98-ST1 du virus WN. Trois semaines apres inoculation du virus WN, les serums 
preleves de souris resistantes (0,045 ml par souris) sont melanges, decomplementes 30 
min a 56°C puis dilues au 1:10 dans du DPBS* (%) supplement avec 0,2% ( v / v ) de 
Serum Albumine bovine (Life Technologies) et 0,05% ( p / v ) d'azide de sodium. Les 
15 serums dilues sont repartis en 0,2 ml et conserves a -20°C. Les serums immuns diriges 
contre la souche IS-98-ST1 sont utilises aux dilutions finales de 1:500 pour Timmuno- 
fluorescence indirecte et au 1:1000 pour Timmunoprecipitation des proteines virales 
radiomarquees. 

Exemple 5 : Utilisation de la souche IS-98-ST1 du virus West Nile pour identifier 
20 les gfcnes cellulaires impliques dans la sensibilite de I'hote a Tinfection aux virus 
de la famille des Flaviviridae. 

1) Methodes 

a) Modele d'analvse de la resistance a Tinfection par les Flaviviri- 
dae (figure 6) 

25 Des souris males des lignees resistantes MAI/Pas et MBT/Pas sont 

croisees avec des souris femelles des lignees sensibles C57BL/6 et BALB/c. Les 
souris males de la generation Fl sont croisees en retour avec des souris femelles des 
lignees resistantes C57BL/6 et BALB/c pour donner une generation de souris de 
premier de premier croisement en retour (BC1). 

30 Des souris BC1 agees de 5 semaines sont inoculees par voie intra- 

peritoneale avec la souche IS-98-ST1, preparee selon le protocole decrit a Texemple 1, 
dans les conditions decrites a Texemple 2. 




2823218 

16 

Les animaux sont observes tous les jours et les taux de mortalite et 
de survie sont determines 14 jours apres F infection. 

b) genotypage des alleles Flv 

Les alleles Flv des individus BC1 ont ete cartographies par PCR 
genomique a Faide d'amorces specifiques de 16 microsatellites du chromosome 5 
(Catalogue Research Genetics) entourant le locus Flv (figures 7-9), selon les 
techniques courantes de biologie moleculaire en utilisant les protocoles standards tels 
que ceux decrits dans Current Protocols in Molecular Biology (Frederick M. 
AUSUBEL,2000, Wiley and son Inc, Library of Congress, USA). 

2)ResuKats 

L'analyse de la distribution des alleles Flv chez les souris BC1 
sensibles et r£sistantes a Tinfection par la souche IS-98ST1 montre qu'un allele FW 
est suffisant pour conferer la resistance a Tinfection (figure 10). Les resultats montrent 
egalement que dans ce modele il existe une correlation parfaite entre le phenotype 
resistant et la presence de Tallele FW et une correlation presque parfaite entre le 
phenotype sensible et Tabsence de {'allele F/v^figurelO). 

Le genotypage des alleles Flv montre que le locus Flv est localise 
dans une region de 0,2 cM contenant le gene OAS 1 (figures 7-9). 



• * 
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REVINDICATIONS 

1°) Souche isolee du virus West Nile, caracterisee en ce que son 
genome est constitue par la sequence SEQ ID NO :1. 

2°) Molecule d'acide nucleique, caracterisee en ce qu'elle est selec- 
5 tionnee dans le groupe constitue par la sequence SEQ ID NO :1, les fragments d'au 
moins 15 nucleotides de la sequence SEQ ID NO : I et les sequences complementaires 
sens et anti-sens des sequences precedentes. 

3°) Molecule d'acide nucleique selon la revendication 2, caracterisee 
en ce qu'elle est choisie dans le groupe constitue par les amorces comprenant au moins 
10 15 nucleotides de la sequence en amont ou en aval de Tun des codons correspondant 
aux positions suivantes dans la sequence nucleotidique SEQ ID NO: 1 : 

- codon Alanine en positions 1117-1119 (position 51 dans la sequence 
en acides amines de la proteine E), 

- codon Asparagine en positions 2518-2520 (position 17 de la 
1 5 sequence en acides amines de la proteine NS 1), 

- codon Arginine en positions 4018-4020 (position 164 de la sequence 
en acides amines de la proteine NS2A), 

- codons Glycine en positions 4462-4464 et acide Glutamique en posi- 
tions 4465-4467 (positions 82 et 83 de la sequence en acides amines de la proteine 

20 NS2B), 

- codons Proline en positions 6097-6099 et acide Glutamique en posi- 
tions 6172-6174 (positions 496 et 521 de la sequence en acides amines de la proteine 
NS3), et 

- codons Serine en positions 7840-7842, Asparagine en positions 
25 8518-8520 et Alanine en positions 8794-8796 (positions 54, 280 et 372 de la sequence 

. en acides amines de la proteine NS5). 

4°) Molecule d'acide nucleique selon la revendication 2 choisie dans 
le groupe constitue par les fragments, de preference entre 50 et 200 nucleotides, ampli- 
fies en utilisant les amorces selon la revendication 3. 
30 5°) Vecteur recombinant, caracterise en ce qu'il comprend une mole- 

cule d'acide nucleique selon Tune quelconque des revendications 2 a 4. 
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6°) Cellule eucaryote, caracterisee en ce qu'elle est transformee par 
une molecule d'acide nucleique selon Tune quelconque des revendications 2 a 4, un 
vecteur selon la revendication 5 ou une souche neurovirulente du virus West Nile selon 
la revendication 1 . 

5 7°) Proteine ou peptide, caracterise en ce qu'il est code par une mole- 

cule decide nucleique selon Tune quelconque des revendications 2 a 4. 

8°) Anticorps polyclonal, caracterise en ce qu'il est susceptible d'etre 
obtenu par immunisation d'un mammifere non-humain avec la souche selon la revendi- 
cation 1. 

10 9 °) Anticorps selon la revendication 8, caracterise en ce que ledit 

mammifere non-humain est une souris hbmozygote pour 1'allele FW de resistance a 

Tinfection par les virus de la famille des Flaviviridae. 

10°) Anticorps polyclonal ou monoclonal, caracterise en ce qu'il est 

susceptible d'etre obtenu par immunisation d'un mammifere non-humain avec un vec- 
15 teur recombinant selon la revendication 5 ou bien une proteine ou un peptide, selon la 

revendication 7. 

11°) Modele d'etude de la sensibilite/resistance a Tinfection par un 
virus de la famille des Flaviviridae, caracterise en ce qu'il comprend au moins une 
souche neurovirulente du virus West Nile selon la revendication 1. 
20 12°) Modele d'etude selon la revendication 11, caracterise en ce qu'il 

comprend en outre une souris homozygote pour 1'allele FW ou FW. 

13°) Precede de detection d'une infection a Flaviviridae, notamment 
du virus West Nile, caracterise en ce qu'il comprend ; 

- l'amplification des ARN issus d'un echantillon biologique a tester en 
25 utilisant comme amorces des molecules d'acide nucleique selon la revendication 3, et 

- le sequenpage du produit d'ampliflcation obtenu. 

14°) Procede de criblage de genes cellulaires impliques dans la resis- 
tance d'un mammifere a I'infection par un virus de la famille des Flaviviridae, caracte- 
rise en ce qu'il comprend les etapes suivantes : 
30 - ™se en culture de cellules derivees d'un hote (humain ou non- 

humain) selectionne pour sa resistance ou sa sensibilite a I'infection par un Flaviviridae, 

- infection in vitro desdites cellules par un Flaviviridae, 
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- detection de genes exprimes de maniere differentielle dans lesdites 

cellules infectees. 

15°) Utilisation du modele selon la revendication 11 ou la revendica- 
tion 12, pour le tri de molecules actives contre une infection virale due a un vims de la 
famille des Flaviviridae. 

16°) Procede de tri de molecules actives contre une infection par un 
Flavivirus, caracterise par : 

- la mise en contact d'une culture de cellules eucaryotes, issues d'un 
mammifere sensible a l'infection 4 un Flaviviridae avec une suspension virale de la 
souche selon la revendication 1, en presence ou en P absence de la molecule a tester et 

- detection de la replication du virus. 

17°) Variant de la souche virale selon la revendication 1, caracterisee 
en ce qu'il comprend au moins une mutation dans la sequence nucleotidique corres- 
pondant aNS5. 
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c 

CI MSKKPGGPGKS RA VNML K RG M P R VL S L I G L X RAM L S L I OG KG P I R F V LAX 

FLA MSKKPGG PGKS RAVNMLKRGMPRVLS L I G 1KRAMLS L I DG KG P I RFVLA.L 

CI LAFFRFTAIAPTRAVLDRWRGVMKQTAMKKLLSfKKELGTLTSAIN'RRSS 
FLA LA F FR FT A I APT RA VL D RW RG VN KQTAMKK L L S FKK E LG T LT S A 1 N R R S S 

prM 

CI KQKKRGGKTGIAVMIGLIASVGAVTLSNFQGKVMiMTVNATDVTDVITIPT 
FLA KQKKRGG KTG I AVM I GLIAS VGAVT LSM FQG KVHMTVNAT DVT D V I ? I ?? 



CI AAGKNLCI VRAMDVG YMCDDT I T YECPVLSAGN D PEDI DCWCTKSAVYVR 

FLA AAGKNLC I VRAMDVG YMCDDT I TYECPVLSAGNDPED I DCWCTKSAVYVR 

M 

CI YGRCT KT RH SRRS RRS LT VQT H G E S T L AN KXG AWM DS T KAT R Y L VKT E S W 

FLA YGRCTKTRHSRRSRRSLTVQTKGSSTLANKKGAWMDSTKATRYLVKTESW 

E 

CI I LRN PG Y AL VAAVI G WMLG S NTMQRVV FV VL L L LVAP A YS FNC LGMS N R D 

FLA I LRN P G Y AL VAA V I G W ML G S NT R V V F WLLL L V A P A Y S FN C LG M S N R D 

CI FLEGVSGATWVDLVLEGDSCVTIMSKDKPTIDVKMMNMEAAMLAEVRSYC 

FLA FLEGVSGATWVDL V1EGDSC VT IMSKDKPT I DVKMMNMEA.VNLAEVR5 YC 

CI YLATVSDLSTKAACPTMGEAHNDKRADPAFVCRQGVVDRGWGNGCGLFGX 

FLA YLATVSDLSTKAACPTMGEAHNDKRADPAFVCRQGVVDRGWGNGCGLFGK 
+ + + + * + + * + + + + + + + + + + + + + + + + + + + * + + + + 

CI • GSI DTCAKFACSTKAIGR7ILKE&IKYEVAI FVKGPTTVESHGNYSTQVG 

FLA GS I DTC AK FACS T KAI GRT I LKE N I KY EVA I FVHG ?TT VE S HG N YSTQVG 

CI ATQAGRFS IT PAAPS YTLKLGE YGE VTVDC E PRSG I DTNA Y YVMT VGT KT 

FLA ATQAGRFS IT PAAPS YTLKLGE YGE VTVDCEPRSG I DTNAYYVMTVGTKT 

CI FLVHREWFMDLNLPWSSAGSTVWRNRETLMEFEEPHATKQSVIALGSQEG 

FLA FLVHREWFMDLNLPWSSAGSTVWRNRETLMEFEEPHATKQSVIALGSQEG 

CI ALHQALAGAIPVEFSSNTVKLTSGHLKCRVKMEKLQLKGTTYGVCSKAFK 

FLA ALHQALAGAIPVEFSSNTVKLTSGHLKCRVKMEKLQLKGTTYGVCSKAFK 

CI FLGT PADTGHGT VVLE LQ YTGT DG PCKV PISS VASLN DLT PVGRL VT VN ? 

FLA FLGTPADTGHGTVVLELQYTGTDGPCKVPISS VASLN DLT PVGRLVTVNP 

CI FVSVATANAECVLIELEPPFGDSYIVVGRGEQQIMHHWHKSGSSIGKAFTT 

FLA F VS V AT ANAK VL IELEPPFGDSYI V VG RG E QQ I N H HWK KS G S S I G KA FTT 
* + + + ★ + + * + + + + + * + * + + + + + * + * + + * + + * 



FIGURE 1A 



» # 
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TLKGAQRLAALGDTAHDrGSVGGVFTSVGKAVHQVrGGAFRSLFGGMSWI 
« » • TLKGAQRLAALGDTAWDFGSVGGVFTSVGKAVHQVFGuA: RSi.r GGMSa * 

FLA *************************-"**'-***-*''" , '"'' 

NS1 

TQGLLGALLLWMGINARORSIALTrLAVGGVLLFLSVNVHADTGCAI DI 3 

« tqgllgalllwhginardrsialtflavggvllflsvnvhadtgca,d :! 



RQE LRCGNG VF I H N DV EAWM DR Y X Y Y ? E7 PQG LAK 1 I QKAK X EG VCG L 3 S 
RQEWC GSGVFIHNDVEAWMDRYKYY?STPQGLAKIIQKAHK£GVCGi,aS 



CI 



CI 
FLA 



CI 
FLA 



CI 



CI 



CI 



************- 
**** * * * ** * * • * ■ ■- - - * - — *" 




KLEIGWKAWGKSILFAPEIJUWTFVVDGPETXECPTQNRAWNS1EVEDFG 
C ' KLEIGWKAWGKSILFAPSLANNTr VVDGPETKECPTQNRAWNSLEVEDFG 

FLA ..*♦. ********* *,***-* 

FGLTSTRMFLKVRESNTTECDSKIIGTAVKNNLAIHSDLSYWIESRLNDT 
«5» FGLTSTRMFLKVRESNTTECDSKIIGTAVKSNLAIHSDLSyWiESRuNDi 
FLA .»♦..**+♦♦.****.♦****♦♦***********♦♦*******-** 

WKLERAVLGEVKSCTWPETHTLWGDGILESDLIIPVTLA.GPRSNHNRRPG 
" A wkLERAVLGEVKSCTWPETHTLWGDC-ILESDLIIPVTLAGPRSNHNRkPG 



********************** *********************** ** 



YKTQNQGPWDEGRVEIDFDYCPGTTVTLSESCGKRGPATRTTTESG^x- 

r Ttt y|(xqhqg pwoegrveidfdycpgttvtlsescgergpatrtttesgki.it 

FLA ****;***********************************"***'*'" 

NS2A 

DWCCRSCTLPPLRYQTDSGCWYGMEIRPQRHDEKTLVQSQVNAYNADMID 
DWCCRSCTLPPLRYQTDSGCWYGMEI RPQRKDEKTLVQSQVNAYNADMi D 
************************* *****- *******-***** ****** 



prQLGLLWELATQEVLRKRWTAKISMPAILIALLVLVFGGITYTDVLRY 
PFQLGLLVVrLATQEVLRKRWTAKISW?AILIALLVLVFGGITYTDVX.RY 
CljK ******************* *********************"*****"** 

VI LVGAA^AESNSGGDWHLALMATFKIQPVFMVAS FLKARWT NQEN ILL 
VI LVGAAFAESNSGGDWKLALMATFK IQ? VFMVAS FLKARWTNQENI LL 



FLA VI LVGW - - - _ _ . _ . * * * ***** * * * ****** * * - * 



MLAAVFFQMAYKDARQILLWEIPDVLNSLAVAWMILRAITFTTTSNWVP 
- MLAAVFFQMAYKDASQILLWEIPDVLNSLAVAWMILRAITFTTTSNVWf 
FLA ************.*****-*>*-*************************** 



LLALLTPRLRCLNLDVYRILLLMVGIGSLIREKRSAAAKKKGASLLCLAL 
LLALLT°GLRCLl.LDVYRILLLMVGIGSLIREKRSAAAKKKGASLLC;jAi. 

LA :****** **,******************•***--*************** 

MS 2 3 

ASTGLFN°MILAAGLIACDPNRKRGW?ATEVMTAVGLMFAIVGGLAELDI 
„ • aSTGLFNPMILAAGLIACDPNRKRGWPATEVMT.AVGLMFAIVGGLAEl.DI 

* + + * + + + ★ + + •*• + + * + ****•**■*"*■*** 



DSMAIPMTIAGLMFAAFVISGK5TDMWIERTADISWE3DAEITGSSERVD 
„. DSMAIPMTIAGLMFAAFVISGKSTDM'WIERTADISWESDAEITGSSERVD 
FLA ************************************** ************ 



VRLDDGENFQLMNDPGAPWKIWMLRMVCLAISAYTPWAILPSVVGFWITL 
FIGURE IB 



2823218 

3/13 

FLA VRLDDDGNFQLMNDPGAPWKIWMLRMVCLAISAYTPWAILPSVVGFWITL 



MS 3 

CI QYTKRGGVLWDTPSPKEYKKGDTTTGVYRIMTRGLLGSYQAGAGVMVEGV 
FLA Q YT KRGG VL WDT P S PKE YXKG DTT TG V Y R I MT RG L LG 5 YQAG AG VMVEG V 



C I FHT LvvHTT KGAA L-MSGEGRLDPYWGS VKE DRLC YGG ?WKLQHrC-;NGQOEV 

FLA FHT LWH ?T KGAALMSGEG RLD ? Y WG3 VKE D R LC YGG PWKLQK KWNGQ DE V 



CI QMIWEPGKNVKNVQTKPGVFKTPEGEIGAV7LDFP7GTSGSPIVDKNGD 

FLA QMI WE PGKNV KM VQT K?G V FKT ? EG E I G A VT LDFPTGTSGSPI 7DKNG D 

+ *+ *»**-******** + ++ + + »****^******.„»** v .* *.»********.* 

CI VIGLYGNGVIMPNGSYISAIVQGERWDEPIPAGrEPEMLRKKQrTV'LDLH 

FLA VIGLYGNGVIMPNGSYISAIVQGERMDEPI PAGFEPEMLRKKQITVLDLH 

CI PG AG KT RR I L ?Q 1 1 KE AI NR R L RTAV LA ? T R WAAEMAEAL RG L ? I R YQT 

FLA PGAGKTRRI L ?Q 1 1 KEAI NRRLRT A VLAFTRVVAAEMAEALRGL ? I R YQT 
★ ★♦i*******^**********,**-^***.-**************,,***** 

CI SAVPREHNGNEIVDVMCHATLTHRLMS PHRVPNYNLFVMDEA.fi TTDPAS I 

FLA S A VP RE K NG NE I V D VMC H A.T LT K RLM S PH RVPN YN L FVMDE AH FT D PAS I 

CI AARGYISTKVELGEAAAIFMTATPPGTSDPFPESNSPISDLQTEIPDRAW 

FLA AA'RG YISTKVELG EAAAJ FMTAT PPGTSDPFPESNSFISDLQTEIPD RAW 

CI NSGYEWITEYTGKTVWFVPSVKMGNEIALCLQRAGXXVVQLNRKSYETEY 

FLA NSGYEWITEYTGKTVWFVPSVKMGNEIALCLQRAGKKWQLNRKSYETEY 



CI PKCKNDDWDFVITTDISEMGANFKASRVIOSRKSVKPTIITEGEGRVILG 

FLA PKCKNDDWDFVITTDISEMGANFKASRVIDSRKSVKPTI ITEGEGRVILG 

+ + + + + + ^ + *tr** + + **4t + + ** + + + + ****v~i,4,* + * + *+* v + „ + w * + + + i r 

CI EPSAVTAASAAQRRGRIGRNPSQVGDEYCYGGHTNEDDSNFAHWTEARIM 
FLA E PS A VT AAS AAQRRGR I G RN PS QVG D E YC YGG H T N E D DS N FAH WT EAR I M 

CI PDNINMPNGLIAQFYQPEREKVYTMEGEYRLRGEERKN FLELLRTADLPV 

FLA LDNINMPNGLIAQFYQPEREFO/YTMDGEYRLRGEERKNFLELLRTADLPV 

+ *+ + + ^+*** + ** + *->ir* + -r*ir+* + ****^» + ^.** + ******* + ^* + *^ 

CI WL A Y KVAAAG VS Y H D RR WC FDG P RT MT I L E D N N E V E V I T KLG ERKILRPR 

FLA WLAYKVAAAGVSYHDRRWCFDGPRTMTILEDNNEVEVITKLGERKILRPR 

NS4A 

CI W I DARVYS DHQALKAFKDFASGKRSQI GLI E VLGKMPEH FMGKTWEALDT 

FLA WIDARVYSDHQALKAFKDFASGKRSQIGLISVLGKMPE.H FMGKTWEALDT 

* + + + + + *** + + ** + *** + * + + + + * + + + + + + *i r + + ^ ir + + + ± + ± + + + <r * + ie + 

CI M Y V V AT AE KG G RAH RMA L EE L ? DALQT I AL I ALL S VMTMG V F FL LMQ RKG 

FLA MYVVATAEKGGRAHRMALEELP DALQTI ALT ALLS VMTMG VFFLLMQRKG 

*** + + * + * + ***** + ** + ** w * # **^* + + + + + + + + + ^ + + + + + + w + ^^.^.^. + 

CI IGKIGLGGAVLGVATFFCWMAEVPGTKIAGMLLLSLLLMIVLI PEPEKQR 
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I G K I G LGG A VLG VAT F FCWMAE V ?G T K I AG ML L LS L L LM I VL I P E P E KQ R 

NS4B 

SQTDNQLAVFLICVMTLVSAVAANEttGWLDKTXSDISSLFGQRIEVKENF 
S QT ON QL A V t L I C VMT L VS A V AAN E MGW 1 OXT KS D I S S L FGQ R I E V KE N F 
* + * + + + + + + + * + + + + 

SMGE FLLDLRPATAWS L YAVTTAVL? PLLKHLI 75 D Y I NTS LTS IN VQAS 
SMGE FLLDLRPATAWS LYAVTTAVLTPLLXHLiTSDYI NTS1TS IN VQA.S 

ALFTLARGF PFVDVGVSALLLAAGCWGQVTLTVTVTAATLLF CHYAYMVP 
AL FT LARG F P FV D VG V S AL L L AAGCW GQ VT LTV? VTAATLL FC K YA YMV ? 



GWQAEAMRS AQRRTAAG I MKMA.VVDG I VATDVPE LERTTPIMQKKVGQ IM 
GWQAEAM RS AQRRT AAG X MKN A VV DG Z VAT DV ?E LE RTT P I MQKKVGQ I M 

L I L VS LAAVWNPS VKT VREAG I L I TAAAVTLWENGAS S VWNATTA I GLC 
LI L VS LAAVWN PS VKT VRE AG I L I ? AAA VT 1 WI N'G AS S VWNATTA. I G LC 

N55 

H I MRGGWLSCLS I TWTLIKNME KPGLKRGGAKG RTLGE VWKE RL NQMT KE 
HIMRGGWLSCLSITWTLIKNMEKPGLKRGGAKGRTLGEVWKERLNQMTKE 

EFTRYRKEAIIEVQRSAAKHARKEGNVTGGHSVSRGTAXLRWLVERRFLE 
EFTRYRKEAIIEVDRSAAKHARKEGNVTGGHPVSRGTAKLRWLVERRFLE 

PVGKVIDLGCGRGGWCYYMATQKRVQEVRGYTKGGPGHEEPQLVQSYGWN 
PVGKVIDLGCGRGGWCYYMP.TQKRVQEVRGYTKGGPGHEEPQLVQSYGWN 

IVTMKSGVDVFYRPSECCDTLLCDIGESSSSAEVEEKRTIRVLEMVEDWL 
IVTMKSGVDVFYRPSECCDTLLCDrGESSSSAEVEEHRTIRVLSMVEDWL ' 

HRGPREFCVKVLCPYMPKVIEKMELLQRRYGGGLVRNPLSRNS7KEMYWV 

HRGPREFCVKVLCPYMPKVIEKMELLQRRYGGGLVRNPLSRNSTHEMYWV 
+ + ** + * + * + *+ + + + ±* + i r ** + i r v + + + + + + + + + + ^ + + + il . + if + + + 4 rir +. irir + ir 

SRASGNVVHSVNMTSQVLLGRMEKRTWKGPQYEEDVNLGSGTRAVGKPLL 

SRASGNWHSVNMTSQVLLGRMEKRTWKGPQYEEDVNLGSGTRAVGKPLL 
+ + ^***** + ** + * + + + *^i + ^ wv + + + ^^^^^^^^ + + ^ + + ^^ v + + +-)tir + ^ + 

NSDTSKINNRIERLRREYSSTWHHDENHPYRTWN-YHGSYDVKPTGSASSL 
NSDTSKIKNRIERLRREYSSTWHHDENKPYRTWNYHGSYDVKPTGSASSL 

VNGVVRLLSKPWDTITNVTTMAMTDTTPFGQQRVFKEKVDTKAPEPPEGA 
VNGVVRLLSKPWDTITNVTTMAMTDTTPFGQQRVFKEKVDTKAPEPPEGV 

KYVLNETTNWLWAFLAREKRPRMCSREEFIRKVN'SNAALGAMFEEQNQWR 
KYVLNETTNWLWAFLAREKRPRMCSREEFIRKVMSNAALGAMFEEQNQWR 



SAREAVEDPKFWEMVDEEREAHLRGECHTCIYNMMGKREKKPGEFGKAKG 
FIGURE ID 
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FLA SAREAVEDPKFWEMVDE£REAHLRG£CKTCIYN*MMGK?XKKPGEFGKAKG 



CI SRAIWFMWLGARFLEFEALGFLNTDHWLGRKNSGGGVEGLGLQKLGYILR 

FL A 5RAIWFMWLGARFLEFEALGFLNEDHWLGRKNSGGGVEGLGLQKLGYILR 

CI EVGTRPGGKIYADDTAGWDTRITRADLSNEAKVLELLDGEHRRLARAIIE 

FLA EVGTRPGGKI YADDTAGWD7RI TRADLENEAKVLELLDGEHRRLARAI I E 



CI LT Y RHK VVKVMRPAADG RT VMD V I S RE DQRGSGQ V VT YALNT FTNLAVQL 

FLA LTYRHKVVKVMRPAADGRTVMDVISRSDQRGSGQVVT YALNT FTNLAVQL 

♦ ♦♦fr*********************************'********-**** 

CI VRMMEG EG V I G P D D VEKL T KG KG ? KVR7 Wl FE NG E E R L S RMA VSG D DC W 

FLA VRMMEGEGVIGPDDVEKLTKGKGPKVRTWL FENGEERLS RM.AVSGDOCVV 

CI KPLDDRFATSLKFLNAMSKVRKDIQEWKPSTGWYDWQQVPFCSNKFTELI 
F LA KPLDDRFATSLHFLNAMSFCVRKDIQEWKPSTGWYDWQQVPFCSNKFTELI 
+ + + + * + + + + + + + + * + + + + + + + + + * + * + + * + + * + 

CI MKDGRTLWPCRGQDELVGRA.RIS PGAGWNVRDTACLAKS YAQMWLLLYF 

FLA MKDGRTL WPCRGQDELVGRARI S PGAGWNVRDTACLAKS YAQMWLLLYF 



Ci HRRDLRLMANAICSAVPVNW?TGR?TWSIKAGGEWMTTEDMLEVWNRV*W 

FLA K RR D L RLMAN A I C S A V P VN WV PTG RT T WS I H AGG E WMTT E DMLE VWN RVW 

CI IEENEWMEDKTPVEKWSDVPYSGKREDIWCGSLIGTRARATWA.ENIQVAI 

FLA I EENEWMEDKT PVEKWS DVP YSGKRE D IWCGS L IGT RARATWAEN IQVAI 

CI NQVRAI I G DEK YVDYMSSLKR Y EDTTLVE DTVL 

FLA NQVRAI IGDEKYVDYMSSLKRYEDTTLVEDTVL 



FIGURE IE 
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jour post-inoculation 



FIGURE 2 



II 

C «g 

s d 

Erd 

09 CD 

u o 
•rj O 



a 10 'i 

a; 3 

S 10 8 
o 

dJQ 

g 10 6 - 



9 (3 souris/temps) 



10 



5, 



10 

io 3 J- 



10 2 * 



10 J 



seuil de detection 



7 



jour post-inoculation 



FIGURE 3 



m 



2823218 



B 

© 

a; 
a> 

3- 

cr 



7/13 




CO 



o 
<M 

r-f 

O 

ON 



o 



o 



in 



in 

u 



















1 y '"5 






::.fn>:ijr.i:;fo. 



NM sruiA 



CM 
O 

3 

CO 



a; 
U 




# 



2823218 



9/13 



Souris 

Lignees consanguines de laboratoire : 



Souris sauvages : 



BALB/c, C57BL/6, DDK, 129, C3H et DBA/1 
-» sensibles a ]' infection par le virus WN 



SEG/Pas (Mus spretus), MAI/Pas, MBT/Pas (Mus m. musculus) 
-» resistantes a l'infection par le virus WN 

Generation de souris de premier croisement en retour (BC1) 



Parents 



Fl 



c^MAI/Pas £C57BL/6 
cfMBTVPas £ BALB/c 



I 



cPFl 



2-C51BU6 
£ BALB/c 
I 



BC1 



a)BCl b)BCl c)BCl d) BC1 

(C57BU6 (C57BU6 (BALB/c (BALB/c 

x x x x 

MAI) MBT) MAI) MBT) 



Virus 

Injection du virus West Nile (WN) 
Souris agees de 5 semaines 

Observation des souris pendant les 14 jours suivant l'infection 
Genotypage des alleles Flv 

marqueurs flanquant le locus Flv sur le chromosome 5 de la souris 



FIGURE 6 
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Parents de la generation de premier croisement en retour (BC1) 



No3 No.107 No.27 No. 154 No.222 No.244 NoA46 NoJl 



ChrS de souris 



D5MU321 
D5MU247 



o 

T 




Pfaenotype; R 



R 



.R 



R 



R R 
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i 

LISTE DE SEQUENCES 

<110> INSTITUT PASTEUR 

<120> SOUCHE NEUROVI RULENTE DU VIRUS WEST NILE ET SES 
APPLICATIONS 

<130> 226CAS93FR 

<140> 
<141> 

<160> 4 

<170> Patentln Ver. 2.1 

<210> 1 

<211> 11029 

<212> ARN 

<213> Flavi virus sp. 

<220> 
<221> CDS 

<222> (97) (10395) 
<400> 1 

agtagttcgc ctgtgtgagc tgacaaactt agtagtgttt gtgaggatta acaacaatta 60 

acacagtgcg agctgtttct tagcacgaag atctcg atg tct aag aaa cca gga 114 

Met Ser Lys Lys Pro Gly 
1 5 

ggg ccc ggc aag age egg get gtc aat atg eta aaa cgc gga atg ccc 162 
Gly Pro Gly Lys Ser Arg Ala Val Asn Met Leu Lys Arg Gly Met Pro 
10 15 • 20 

cgc gtg ttg tec ttg att gga ctg aag agg get atg ttg age ctg ate 210 
Arg Val Leu Ser Leu lie Gly Leu Lys Arg Ala Met Leu Ser Leu lie 
25 30 35 

gac ggc aag ggg cca ata cga ttt gtg ttg get etc ttg gcg ttc ttc 258 
Asp Gly Lys Gly Pro lie Arg Phe Val Leu Ala Leu Leu Ala Phe Phe 
40 45 50 

agg ttc aca gca att get ccg acc cga gca gtg ctg gat cga tgg aga 3 06 
Arg Phe Thr Ala lie Ala Pro Thr Arg Ala Val Leu Asp Arg Trp Arg 
55 60 65 70 

ggt gtg aat aaa caa aca gcg atg aaa cac ctt ctg agt ttt aag aag 3 54 
Gly Val Asn Lys Gin Thr Ala Met Lys His Leu Leu Ser Phe Lys Lys 
75 80 85 



gaa eta ggg acc 
Glu Leu Gly Thr 
90 



ttg acc 
Leu Thr 



agt get ate aat egg egg age tea aaa caa 
Ser Ala He Asn Arg Arg Ser Ser Lys Gin 
95 100 



402 



• 
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aag aaa aga gga gga aag acc gga att gca gtc atg ate ggc ctg ate 4 50 
Lys Lys Arg Gly Gly Lys Thr Gly lie Ala Val Met He Gly Leu He 
105 110 115 

gec age gta gga gca gtt acc etc tct aac ttc caa ggg aag gtg atg 4 98 
Ala Ser Val Gly Ala Val Thr Leu Ser' Asn Phe Gin Gly Lys Val Met 
120 125 130 

atg acg gta aat get act gac gtc aca gat gtc ate acg att cca aca 54 6 
Met Thr Val Asn Ala Thr Asp Val Thr Asp Val He Thr He Pro Thr 
135 140 145 150 

get get gga aag aac eta tgc att gtc aga gca atg gat gtg gga tac 594 
Ala Ala Gly Lys Asn Leu Cys He Val Arg Ala Met Asp Val Gly Tyr 
155 160 165 

atg tgc gat gat act ate act tat gaa tgc cca gtg ctg teg get ggt 642 
Met Cys Asp Asp Thr He Thr Tyr Glu Cys Pro Val Leu Ser Ala Gly 
170 175 180 

aat gat cca gaa gac ate gac tgt tgg tgc aca aag tea gca gtc tac 690 
Asn Asp Pro Glu Asp He Asp Cys Trp Cys Thr Lys Ser Ala Val Tyr 
185 190 ' 195 

gtc agg tat gga aga tgc acc aag aca cgc cac tea aga cgc agt egg 73 8 
Val Arg Tyr Gly Arg Cys Thr Lys Thr Arg His Ser Arg Arg Ser Arg 
200 205 210 

agg tea ctg aca gtg cag aca cac gga gaa age act eta gcg aac aag 786 
Arg Ser Leu Thr Val Gin Thr His Gly Glu Ser Thr Leu Ala Asn Lys 
215 220 225 230 

aag ggg get tgg atg gac age acc aag gee aca agg tat ttg gta aaa 8 34 
Lys Gly Ala Trp Met Asp Ser Thr Lys Ala Thr Arg Tyr Leu Val Lys 
235 240 245 

aca gaa tea tgg ate ttg agg aac cct gga tat gee ctg gtg gca gee 882 
Thr Glu Ser Trp lie Leu Arg Asn Pro Gly Tyr Ala Leu Val Ala Ala 
250 255 260 

gtc att ggt tgg atg ctt ggg age aac acc atg cag aga gtt gtg ttt 93 0 
Val He Gly Trp Met Leu Gly Ser Asn Thr Met Gin Arg Val Val Phe 
265 270 275 

gtc gtg eta ttg ctt ttg gtg gee cca get tac age ttt aac tgc ctt 978 
Val Val Leu Leu Leu Leu Val Ala Pro Ala Tyr Ser Phe Asn Cys Leu 
280 285 290 

gga atg age aac aga gac ttc ttg gaa gga gtg tct gga gca aca tgg 102 6 
Gly Met Ser Asn Arg Asp Phe Leu Glu Gly Val Ser Gly Ala Thr Trp 
295 300 305 310 



gtg gat ttg gtt etc gaa ggc gac age tgc gtg act ate atg tct aag 
Val Asp Leu Val Leu Glu Gly Asp Ser Cys Val Thr He Met Ser Lys 
315 320 325 



1074 
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gac aag cct acc ate gat gtg aag atg atg aat atg gag gcg gec aac 1122 
Asp Lys Pro Thr He Asp Val Lys Met Met Asn Met Glu Ala Ala Asn 
330 335 340 

ctg gca gag gtc cgc agt tat tgc tat ttg get acc gtc age gat etc 1170 
Leu Ala Glu Val Arg Ser Tyr Cys Tyr Leu Ala Thr Val Ser Asp Leu 
345 350 355 

tec acc aaa get gcg tgc ccg acc atg gga gaa get cac aat gac aaa 1218 
Ser Thr Lys Ala Ala Cys Pro Thr Met Gly Glu Ala His Asn Asp Lys 
360 365 370 

cgt get gac cca get ttt gtg tgc aga caa gga gtg gtg gac agg ggc 1266 
Arg Ala Asp Pro Ala Phe Val Cys Arg Gin Gly Val Val Asp Arg Gly 
375 380 385 390 

tgg ggc aac ggc tgc gga eta ttt ggc aaa gga age att gac aca tgc 1314 
Trp Gly Asn Gly Cys Gly Leu Phe Gly Lys Gly Ser He Asp Thr Cys 
395 400 405 

gee aaa ttt gec tgc tct acc aag gca ata gga aga acc ate ttg aaa 1362 
Ala Lys Phe Ala Cys Ser Thr Lys Ala He Gly Arg Thr He Leu Lys 
410 415 420 

gag aat ate aag tac gaa gtg gec att ttt gtc cat gga cca act act 1410 
Glu Asn He Lys Tyr Glu Val Ala He Phe Val His Gly Pro Thr Thr 
425 430 435 

gtg gag teg cac gga aac tac tec aca cag gtt gga gec act cag gca 1458 
Val Glu Ser His Gly Asn Tyr Ser Thr Gin Val Gly Ala Thr Gin Ala 
440 445 450 

ggg aga ttc age ate act cct gcg gcg cct tea tac aca eta aag ctt 1506 
Gly Arg Phe Ser lie Thr Pro Ala Ala Pro Ser Tyr Thr Leu Lys Leu 
455 460 465 470 



gga gaa tat gga gag gtg aca gtg gac tgt gaa cca egg tea ggg att 1554 
Gly Glu Tyr Gly Glu Val Thr Val Asp Cys Glu Pro Arg Ser Gly He 
475 480 ~ 485 

gac acc aat gca tac tac gtg atg act gtt gga aca aag acg ttc ttg 1602 
Asp Thr Asn Ala Tyr Tyr Val Met Thr Val Gly Thr Lys Thr Phe Leu 
490 495 500 



gtc cat cgt gag tgg ttc atg gac etc aac etc cct tgg age agt get 1650 
Val His Arg Glu Trp Phe Met Asp Leu Asn Leu Pro Trp Ser Ser Ala 
505 510 515 



gga agt act gtg tgg agg aac aga gag acg tta atg gag ttt gag gaa 1698 
Gly Ser Thr Val Trp Arg Asn Arg Glu Thr Leu Met Glu Phe Glu Glu 
520 525 530 

cca cac gec acg aag cag tct gtg ata gca ttg ggc tea caa gag gga 1746 
Pro His Ala Thr Lys Gin Ser Val" lie Ala Leu Gly Ser Gin Glu Gly 
535 540 545 550 
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get ctg cat caa get ttg get gga gec att cct gtg gaa ttt tea age 1794 
Ala Leu His Gin Ala Leu Ala Gly Ala He Pro Val Glu Phe Ser Ser 
555 560 565 

aac act gtc aag ttg acg teg ggt cat ttg aag tgt aga gtg aag atg 1842 
Asn Thr Val Lys Leu Thr Ser Gly His Leu Lys Cys Arg Val Lys Met 
570 575 580 

gaa aaa ttg cag ttg aag gga aca ace tat ggc gtc tgt tea aag get 1890 
Glu Lys Leu Gin Leu Lys Gly Thr Thr Tyr Gly Val Cys Ser Lys Ala 
585 590 595 

ttc aag ttt ctt ggg act ccc gca gac aca ggt cac ggc act gtg gtg 193 8 
Phe Lys Phe Leu Gly Thr Pro Ala Asp Thr Gly His Gly Thr Val Val 
600 605 610 

ttg gaa ttg cag tac act ggc acg gat gga cct tgc aaa gtt cct ate 1986 
Leu Glu Leu Gin Tyr Thr Gly Thr Asp Gly Pro Cys Lys Val Pro He 
615 620 625 630 

teg tea gtg get tea ttg aac gac eta acg cca gtg ggc aga ttg gtc 2034 
Ser Ser Val Ala Ser Leu Asn Asp Leu Thr Pro Val Gly Arg Leu Val 
635 640 645 

act gtc aac cct ttt gtt tea gtg gec acg gee aac get aag gtc ctg 2 082 
Thr Val Asn Pro Phe Val Ser Val Ala Thr Ala Asn Ala Lys Val Leu 
650 655 660 

att gaa ttg gaa cca ccc ttt gga gac tea tac ata gtg gtg ggc aga 213 0 
He Glu Leu Glu Pro Pro Phe Gly Asp Ser Tyr He Val Val Gly Arg 
665 670 675 

gga gaa caa cag att aat cac cat tgg cac aag tct gga age age att 2178 
Gly Glu Gin Gin He Asn His His Trp His Lys Ser Gly Ser Ser He 
680 685 690 

ggc aaa gee ttt aca acc acc etc aaa gga gcg cag aga eta gee get 2226 
Gly Lys Ala Phe Thr Thr Thr Leu Lys Gly Ala Gin Arg Leu Ala Ala 
695 700 705 710 

eta gga gac aca get tgg gac ttt gga tea gtt gga ggg gtg ttc acc 2274 
Leu Gly Asp Thr Ala Trp Asp Phe Gly Ser Val Gly Gly Val Phe Thr 
715 720 ' 725 

tea gtt ggg aag get gtc cat caa gtg ttc gga gga gca ttc cgc tea 2322 
Ser Val Gly Lys Ala Val His Gin Val Phe Gly Gly Ala Phe Arg Ser 
730 735 740 

ctg ttc gga ggc atg tec tgg ata acg caa gga ttg ctg ggg get etc 2370 
Leu Phe Gly Gly Met Ser Trp lie Thr Gin Gly Leu Leu Gly Ala Leu 
745 750 755 



ctg ttg tgg atg ggc ate aat get cgt gat agg tec ata get etc acg 2418 
Leu Leu Trp Met Gly He Asn Ala Arg Asp Arg Ser lie Ala Leu Thr 
760 765 770 



• 
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ttt etc gca gtt gga gga gtt ctg etc ttc etc tec gtg aac gtg cac 2466 
Phe Leu Ala Val Gly Gly Val Leu Leu Phe Leu Ser Val Asn Val His 
775 780 785 790 

get gac act ggg tgt gee ata gac ate age egg caa gag ctg aga tgt 2514 
Ala Asp Thr Gly Cys Ala He Asp He Ser Arg Gin Glu Leu Arg Cys 
795 800 805 

gga aat gga gtg ttc ata cac aat gat gtg gag get tgg atg gac egg 2562 
Gly Asn Gly Val Phe He His Asn Asp Val Glu Ala Trp Met Asp Arg 
810 815 820 

tac aag tat tac cct gaa acg cca caa ggc eta gee aag ate att cag 2610 
Tyr Lys Tyr Tyr Pro Glu Thr Pro Gin Gly Leu Ala Lys He He Gin 
825 830 835 

aaa get cat aag gaa gga gtg tgc ggt eta cga tea gtt tec aga ctg 2658 
Lys Ala His Lys Glu Gly Val Cys Gly Leu Arg Ser Val Ser Arg Leu 
840 845 850 

gag cat caa atg tgg gaa gca gtg aag gac gag ctg aac act ctt ttg 2706 
Glu His Gin Met Trp Glu Ala Val Lys Asp Glu Leu Asn Thr Leu Leu 
855 860 865 870 

aag gag aat ggt gtg gac ctt agt gtc gtg gtt gag aaa cag gag gga 2754 
Lys Glu Asn Gly Val Asp Leu Ser Val Val Val Glu Lys Gin Glu Gly 
875 880 885 

atg tac aag tea gca cct aaa cgc etc ace gee ace acg gaa aaa ttg 2802 
Met Tyr Lys Ser Ala Pro Lys Arg Leu Thr Ala Thr Thr Glu Lys Leu 
890 895 900 

gaa att ggc tgg aag gee tgg gga aag agt att tta ttt gca cca gaa 2850 
Glu lie Gly Trp Lys Ala Trp Gly Lys Ser He Leu Phe Ala Pro Glu 
905 910 915 

etc gee aac aac acc ttt gtg gtt gat ggt ccg gag ace aag gaa tgt 28 98 
Leu Ala Asn Asn Thr Phe Val Val Asp Gly Pro Glu Thr Lys Glu Cys 
920 925 930 

ccg act cag aat cgc get tgg aat age tta gaa gtg gag gat ttt gga 2 94 6 
Pro Thr Gin Asn Arg Ala Trp Asn Ser Leu Glu Val Glu Asp Phe Gly 
935 940 945 950 

ttt ggt etc acc age act egg atg ttc ctg aag gtc aga gag age aac 2 994 
Phe Gly Leu Thr Ser Thr Arg Met Phe Leu Lys Val Arg Glu Ser Asn 
955 960 965 

aca act gaa tgt gac teg aag ate att gga acg get gtc aag aac aac 3 04 2 
Thr Thr Glu Cys Asp Ser Lys lie He Gly Thr Ala Val Lys Asn Asn 
970 975 980 

ttg gcg ate cac agt gac ctg tec tat tgg att gaa age agg etc aat 3090 
Leu Ala He His Ser Asp Leu Ser Tyr Trp He Glu Ser Arg Leu Asn 
985 990 995 



• 
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gat acg tgg aag ctt gaa agg gca gtt ctg ggt gaa gtc aaa tea tgt 3138 
Asp Thr Trp Lys Leu Glu Arg Ala Val Leu Gly Glu Val Lys Ser Cys 
1000 1005 1010 

acg tgg cct gag acg cat acc ttg tgg ggc gat gga ate ctt gag agt 3186 
Thr Trp Pro Glu Thr His Thr Leu Trp Gly Asp Gly He Leu Glu Ser 
1015 1020 1025 1030 

gac ttg ata ata cca gtc aca ctg gcg gga cca cga age aat cac aat 3234 
Asp Leu He He Pro Val Thr Leu Ala Gly Pro Arg Ser Asn His Asn 
1035 1040 1045 

egg aga cct ggg tac aag aca caa aac cag ggc cca tgg gac gaa ggc 3282 
Arg Arg Pro Gly Tyr Lys Thr Gin Asn Gin Gly Pro Trp Asp Glu Gly 
1050 1055 1060 

egg gta gag att gac ttc gat tac tgc cca gga act acg gtc acc ctg 3330 
Arg Val Glu He Asp Phe Asp Tyr Cys Pro Gly Thr Thr Val Thr Leu 
1065 1070 1075 

agt gag age tgc gga cac cgt gga cct gee act cgc acc acc aca gag 33 78 
Ser Glu Ser Cys Gly His Arg Gly Pro Ala Thr Arg Thr Thr Thr Glu 
1080 1085 1090 

age gga aag ttg ata aca gat tgg tgc tgc agg age tgc acc tta cca 3426 
Ser Gly Lys Leu He Thr Asp Trp Cys Cys Arg Ser Cys Thr Leu Pro 
1095 1100 1105 1110 

cca ctg cgc tac caa act gac age ggc tgt tgg tat ggt atg gag ate 3474 
Pro Leu Arg Tyr Gin Thr Asp Ser Gly Cys Trp Tyr Gly Met Glu He 
1115 1120 1125 

aga cca cag aga cat gat gaa aag acc etc gtg cag tea caa gtg aat 3522 
Arg Pro Gin Arg His Asp Glu Lys Thr Leu Val Gin Ser Gin Val Asn 
1130 1135 1140 

get tat aat get gat atg att gac cct ttt cag ttg ggc ctt ctg gtc 3570 
Ala Tyr Asn Ala Asp Met lie Asp Pro Phe Gin Leu Gly Leu Leu Val 
1145 1150 1155 

gtg ttc ttg gee acc cag gag gtc ctt cgc aag agg tgg- aca gee aag 3618 
Val Phe Leu Ala Thr Gin Glu Val Leu Arg Lys Arg Trp Thr Ala Lys 
1160 1165 1170 

ate age atg cca get ata ctg att get ctg eta gtc ctg gtg ttt ggg 3666 
He Ser Met Pro Ala He Leu He Ala Leu Leu Val Leu Val Phe Gly 
1175 1180 1185 1190 

ggc att act tac act gat gtg tta cgc tat gtc ate ttg gtg ggg gca 3714 
Gly lie Thr Tyr Thr Asp Val Leu Arg Tyr Val He Leu Val Gly Ala 
1195 1200 1205 



get ttc gca gaa tct aat teg gga gga gac gtg gta cac ttg gcg etc 
Ala Phe Ala Glu Ser Asn Ser Gly Gly Asp Val Val His Leu Ala Leu 
1210 1215 1220 



3762 
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atg gcg acc ttc aag ata caa cca gtg ttt atg gtg gca teg ttt etc 3810 
Met Ala Thr Phe Lys He Gin Pro Val Phe Met Val Ala Ser Phe Leu 
1225 1230 1235 

aaa gcg aga tgg acc aac cag gag aac att ttg ttg atg ttg gcg get 3 858 
Lys Ala Arg Trp Thr Asn Gin Glu Asn He Leu Leu Met Leu Ala Ala 
1240 1245 1250 

gtt ttc ttt caa atg get tat cac gat gee cgc caa att ctg etc tgg 3 906 
Val Phe Phe Gin Met Ala Tyr His Asp Ala Arg Gin He Leu Leu Trp 
1255 1260 1265 1270 

gag ate cct gat gtg ttg aat tea ctg gcg gta get tgg atg ata ctg 3954 
Glu He Pro Asp Val Leu Asn Ser Leu Ala Val Ala Trp Met He Leu 
1275 1280 1285 

aga gec ata aca ttc aca acg aca tea aat gtg gtc gtc ccg ctg eta 4002 
Arg Ala He Thr Phe Thr Thr Thr Ser Asn Val Val Val Pro Leu Leu 
1290 1295 1300 

gee ctg eta aca ccc egg ctg aga tgc ttg aat ctg gat gtg tac agg 4050 
Ala Leu Leu Thr Pro Arg Leu Arg Cys Leu Asn Leu Asp Val Tyr Arg 
1305 1310 1315 

ata ctg ctg ttg atg gtc gga ata ggc age ttg ate agg gag aag agg 4 098 
He Leu Leu Leu Met Val Gly He Gly Ser Leu He Arg Glu Lys Arg 
1320 1325 1330 

agt gca get gca aaa aag aaa gga gca agt ctg eta tgc ttg get eta 414 6 
Ser Ala Ala Ala Lys Lys Lys Gly Ala Ser Leu Leu Cys Leu Ala Leu 
1335 1340 1345 * 1350 

gec tea aca gga ctt ttc aac ccc atg ate ctt get get gga ctg att 4194 
Ala Ser Thr Gly Leu Phe Asn Pro Met He Leu Ala Ala Gly Leu He 
1355 1360 1365 

gca tgt gat ccc aac cgt aaa cgc gga tgg ccc gca act gaa gtg atg 4242 
Ala Cys Asp Pro Asn Arg Lys Arg Gly Trp Pro Ala Thr Glu Val Met 
1370 1375 1380 

aca get gtc ggc eta atg ttt gec ate gtc gga ggg ctg gca gag ctt 4290 
Thr Ala Val Gly Leu Met Phe Ala He Val Gly Gly Leu Ala Glu Leu 
1385 1390 1395 

gac att gac tec atg gec att cca atg act ate gcg ggg etc atg ttt 4338 
Asp lie Asp Ser Met Ala He Pro Met Thr lie Ala Gly Leu Met Phe 
1400 1405 1410 

get get ttc gtg att tct ggg aaa tea aca gat atg tgg att gag aga 43 86 
Ala Ala Phe Val He Ser Gly Lys Ser Thr Asp Met Trp He Glu Arg 
1415 1420 1425 1430 



acg gcg gac att tec tgg gaa agt gat gca gaa att aca ggc teg age 
Thr Ala Asp He Ser Trp Glu Ser Asp Ala Glu lie Thr Gly Ser Ser 
1435 1440 1445 



4434 
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gaa aga gtt gat gtt egg ctt gat gat ggt gaa aac ttc cag etc atg 4482 
Glu Arg Val Asp Val Arg Leu Asp Asp Gly Glu Asn Phe Gin Leu Met 
1450 1455 1460 

aat gat cca gga gca cct tgg aag ata tgg atg etc aga atg gtc tgt 4530 
Asn Asp Pro Gly Ala Pro Trp Lys He Trp Met Leu Arg Met Val Cys 
1465 1470 1475 

etc gcg att agt gcg tac ace ccc tgg gca ate ttg ccc tea gta gtt 4578 
Leu. Ala lie Ser Ala Tyr Thr Pro Trp Ala lie Leu Pro Ser Val Val 
1480 1485 1490 

gga ttt tgg ata act etc caa tac aca aag aga gga ggt gtg ttg tgg 4626 
Gly Phe Trp He Thr Leu Gin Tyr Thr Lys Arg Gly Gly Val Leu Trp 
1495 1500 1505 1510 

gac act ccc tea cca aag gag tac aaa aag ggg gac acg ace ace ggc 4674 
Asp Thr Pro Ser Pro Lys Glu Tyr Lys Lys Gly Asp Thr Thr Thr Gly 
1515 1520 1525 

gtc tac agg ate atg act cgt ggg ctg etc ggc agt tat caa gca gga 4722 
Val Tyr Arg He Met Thr Arg Gly Leu Leu Gly Ser Tyr Gin Ala Gly 
1530 1535 1540 

gcg ggc gtg atg gtt gaa ggt gtt ttc cac ace ctt tgg cat aca aca 4770 
Ala Gly Val Met Val Glu Gly Val Phe His Thr Leu Trp His Thr Thr 
1545 1550 1555 

aaa gga gee get ttg atg age gga gag ggc cgc ctg gac cca tac tgg 4818 
Lys Gly Ala Ala Leu Met Ser Gly Glu Gly Arg Leu Asp Pro Tyr Trp 
1560 1565 1570 

ggc agt gtc aag gag gat cga ctt tgt tac gga gga ccc tgg aaa ttg 4866 
Gly Ser Val Lys Glu Asp Arg Leu Cys Tyr Gly Gly Pro Trp Lys Leu 
1575 1580 1585 1590 

cag cac aag tgg aac ggg cag gat gag gtg cag atg att gtg gtg gaa 4 914 
Gin His Lys Trp Asn Gly Gin Asp Glu Val Gin Met He Val Val Glu 
1595 1600 1605 

cct ggc aag aac gtt aag aac gtc cag acg aaa cca ggg gtg ttc aaa 4962 
Pro Gly Lys Asn Val Lys Asn Val Gin Thr Lys Pro Gly Val Phe Lys 
1610 1615 1620 

aca cct gaa gga gaa ate ggg gee gtg act ttg gac ttc ccc act gga 5010 
Thr Pro Glu Gly Glu He Gly Ala Val Thr Leu Asp Phe Pro Thr Gly 
1625 1630 1635 

aca tea ggc tea cca ata gtg gac aaa aac ggt gat gtg att ggg ctt 5058 
Thr Ser Gly Ser Pro He Val Asp Lys Asn Gly Asp Val lie Gly Leu 
1640 1645 1650 



tat ggc aat gga gtc ata atg ccc aac ggc tea tac ata age gcg ata 
Tyr Gly Asn Gly Val He Met Pro Asn Gly Ser Tyr He Ser Ala He 
1655 1660 1665 1670 



5106 
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gtg cag ggt gaa agg atg gat gag cca ate cca gec gga ttc gaa cct 5154 
Val Gin Gly Glu Arg Met Asp Glu Pro He Pro Ala Gly Phe Glu Pro 
1675 1680 1685 

gag atg ctg agg aaa aaa cag ate act gta ctg gat etc cat ccc ggc 5202 
Glu Met Leu Arg Lys Lys Gin He Thr Val Leu Asp Leu His Pro Gly 
1690 1695 1700 

gee ggt aaa aca agg agg att ctg cca cag ate ate aaa gag gec ata 5250 
Ala Gly Lys Thr Arg Arg He Leu Pro Gin He He Lys Glu Ala He 
1705 1710 1715 

aac aga aga ctg aga aca gec gtg eta gca cca ace agg gtt gtg get 5298 
Asn Arg Arg Leu Arg Thr Ala Val Leu Ala Pro Thr Arg Val Val Ala 
1720 1725 1730 

get gag atg get gaa gca ctg aga gga ctg ccc ate egg tac cag aca 5346 
Ala Glu Met Ala Glu Ala Leu Arg Gly Leu Pro He Arg Tyr Gin Thr 
1735 1740 1745 1750 

tec gca gtg ccc aga gaa cat aat gga aat gag att gtt gat gtc atg 53 94 
Ser Ala Val Pro Arg Glu His Asn Gly Asn Glu He Val Asp Val Met 
1755 1760 1765 

tgt cat get acc etc acc cac agg ctg atg tct cct cac agg gtg ccg 5442 
Cys His Ala Thr Leu Thr His Arg Leu Met Ser Pro His Arg Val Pro 
1770 1775 1780 

aac tac aac ctg ttc gtg atg gat gag get cat ttc acc gac cca get 5490 
Asn Tyr Asn Leu Phe Val Met Asp Glu Ala His Phe Thr Asp Pro Ala 
1785 1790 1795 

agt ate gca gca aga ggt tac att tec aca aag gtc gag eta ggg gag 5538 
Ser He Ala Ala Arg Gly Tyr lie Ser Thr Lys Val Glu Leu Gly Glu 
1800 1805 1810 

gcg gcg gca ata ttc atg aca gee acc cca cca ggc act tea gat cca 5586 
Ala Ala Ala He. Phe -Met Thr Ala Thr Pro Pro Gly Thr Ser Asp Pro 
1815 • 1820 1825 " 1830 

ttc cca gag tec aat tea cca att tec gac tta cag act gag ate ccg 5634 
Phe Pro Glu Ser Asn Ser Pro lie Ser Asp Leu Gin Thr Glu He Pro 
1835 1840 1845 

gat cga get tgg aac tct gga tac gaa tgg ate aca gaa tac acc ggg 5682 
Asp Arg Ala Trp Asn Ser Gly Tyr Glu Trp He Thr Glu Tyr Thr Gly 
1850 1855 I860 

aag acg gtt tgg ttt gtg cct agt gtc aag atg ggg aat gag att gee 573 0 
Lys Thr Val Trp Phe Val Pro Ser Val Lys Met Gly Asn Glu lie Ala 
1865 1870 1875 



ctt tgc eta caa cgt get gga aag aaa gta gtc caa ttg aac aga aag 
Leu Cys Leu Gin Arg Ala Gly Lys Lys Val Val Gin Leu Asn Arg Lys 
1880 1885 1890 



5778 
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teg tac gag acg gag tac cca aaa tgt aag aac gat gat tgg gac ttt 5826 
Ser Tyr Glu Thr Glu Tyr Pro Lys Cys Lys Asn Asp Asp Trp Asp Phe 
1895 1900 1905 1910 

gtt ate aca aca gac ata tct gaa atg ggg get aac ttc aag gcg age 5874 
Val He Thr Thr Asp lie Ser Glu Met Gly Ala Asn Phe Lys Ala Ser 
1915 1920 1925 

agg gtg att gac age egg aag agt gtg aaa cca ace ate ata aca gaa 5922 
Arg Val lie Asp Ser Arg Lys Ser Val Lys Pro Thr He He Thr Glu 
1930 1935 1940 

gga gaa ggg aga gtg ate ctg gga gaa cca tct gca gtg aca gca get 5970 
Gly Glu Gly Arg Val He Leu Gly Glu Pro Ser Ala Val Thr Ala Ala 
1945 1950 1955 

agt gee gec cag aga cgt gga cgt ate ggt aga aat ccg teg caa gtt 6018 
Ser Ala Ala Gin Arg Arg Gly Arg He Gly Arg Asn Pro Ser Gin Val 
1960 1965 1970 

ggt gat gag tac tgt tat ggg ggg cac acg aat gaa gac gac teg aac 6066 
Gly Asp Glu Tyr Cys Tyr Gly Gly His Thr Asn Glu Asp Asp Ser Asn 
1975 1980 1985 1990 

ttc gee cat tgg act gag gca cga ate atg ccg gac aac ate aac atg 6114 
Phe Ala His Trp Thr Glu Ala Arg He Met Pro Asp Asn He Asn Met 
1995 2000 2005 

cca aac gga ctg ate get caa ttc tac caa cca gag cgt gag aag gta 6162 
Pro Asn Gly Leu He Ala Gin Phe Tyr Gin Pro Glu Arg Glu Lys Val 
2010 2015 2020 

tat ace atg gag ggg gaa tac egg etc aga gga gaa gag agg aaa aac 6210 
Tyr Thr Met Glu Gly Glu Tyr Arg Leu Arg Gly Glu . Glu Arg Lys Asn 
2025 2030 2035 

ttt ctg gaa ctg ttg agg act gca gat ctg cca gtt tgg ctg get tac 6258 
Phe Leu Glu Leu Leu Arg Thr Ala Asp Leu Pro Val Trp Leu Ala Tyr 
2040 2045 2050 

aag gtt gca gcg get gga gtg tea tac cac gac egg agg tgg tgc ttt 63 06 
Lys Val Ala Ala Ala Gly Val Ser Tyr His Asp Arg Arg Trp Cys Phe 
2055 2060 2065 " 2070 

gat ggt cct agg aca aac aca att tta gaa gac aac aac gaa gtg gaa 63 54 
Asp Gly Pro Arg Thr Asn Thr He Leu Glu Asp Asn Asn Glu Val Glu 
2075 2080 2085 

gtc ate acg aag ctt ggt gaa agg aag att ctg agg ccg cgc tgg att 6402 
Val He Thr Lys Leu Gly Glu Arg Lys He Leu Arg Pro Arg Trp He 
2090 2095 2100 



gac gee agg gtg tac teg gat cac cag gca eta aag gcg ttc aag gac 
Asp Ala Arg Val Tyr Ser Asp His Gin Ala Leu Lys Ala Phe Lys Asp 
2105 2110 2115 



6450 



2823218 



li 



ttc gcc teg gga aaa cgt tct cag ata ggg etc att gag gtt ctg gga 
Phe Ala Ser Gly Lys Arg Ser Gin lie Gly Leu He Glu Val Leu Gly 
2120 2125 2130 



6498 



aag atg cct gag cac ttc atg ggg aag aca tgg gaa gca ctt gac acc 
Lys Met Pro Glu His Phe Met Gly Lys Thr Trp Glu Ala Leu Asp Thr 
2135 2140 2145 2150 



6546 



atg tac gtt gtg gcc act gca gag aaa gga gga aga get cac aga atg 
Met Tyr Val Val Ala Thr Ala Glu Lys Gly Gly Arg Ala His Arg Met 
2155 2160 2165 



6594 



gcc ctg gag gaa ctg cca gat get ctt cag aca att gcc ttg att. gcc 
Ala Leu Glu Glu Leu Pro Asp Ala Leu Gin Thr He Ala Leu He Ala 
2170 2175 2180 



6642 



tta ttg agt gtg atg acc atg gga gta ttc ttc etc etc atg cag egg 
Leu Leu Ser Val Met Thr Met Gly Val Phe Phe Leu Leu Met Gin Arg 
2185 2190 2195 



6690 



aag ggc att gga aag ata ggt ttg gga ggc get gtc ttg gga gtc gcg 
Lys Gly He Gly Lys He Gly Leu Gly Gly Ala Val Leu Gly Val Ala 
2200 2205 2210 



6738 



acc ttt ttc tgt tgg atg get gaa gtt cca gga acg aag ate gcc gga 
Thr Phe Phe Cys Trp Met Ala Glu Val Pro Gly Thr Lys lie Ala Gly 
2215 2220 2225 " 2230 



6786 



atg ttg ctg etc tec ctt etc ttg atg att gtg eta att cct gag cca 
Met Leu Leu Leu Ser Leu Leu Leu Met He Val Leu He Pro Glu Pro 
2235 2240 2245 



6834 



gag aag caa cgt teg cag aca gac aac cag eta gcc gtg ttc ctg att 
Glu Lys Gin Arg Ser Gin Thr Asp Asn Gin Leu Ala Val Phe Leu He 
2250 2255 2260 



6882 



tgt gtc atg acc ctt gtg age gca gtg gca gcc aac gag atg ggt tgg 
Cys Val Met Thr Leu Val Ser Ala Val Ala Ala Asn Glu Met Gly Trp 
2265 2270 2275 



6930 



eta gac aag acc aag agt gac ata age agt ttg ttt ggg caa aga att 
Leu Asp Lys Thr Lys Ser Asp lie Ser Ser Leu Phe Gly Gin Arg He 
2280 2285 2290 



6978 



gag gtc aag gag aat ttc age atg gga gag ttt ctt ctg gac ttg agg 
Glu Val Lys Glu Asn Phe Ser Met Gly Glu Phe Leu Leu Asp Leu Arg 
2295 2300 2305 2310 



7026 



ccg gca aca gcc tgg tea ctg tac get gtg aca aca gcg gtc etc act 
Pro Ala Thr Ala Trp Ser Leu Tyr Ala Val Thr Thr Ala Val Leu Thr 
2315 2320 2325 



7074 



cca ctg eta aag cat ttg ate acg tea gat tac ate aac acc tea ttg 7122 
Pro Leu Leu Lys His Leu lie Thr Ser Asp Tyr He Asn Thr Ser Leu 
2330 2335 2340 
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acc tea ata aac gtt cag gca agt gca eta ttc aca etc gcg cga ggc 7170 
Thr Ser He Asn Val Gin Ala Ser Ala Leu Phe Thr Leu Ala Arg Gly 
2345 2350 2355 

ttc ccc ttc gtc gat gtt gga gtg teg get etc ctg eta gca gee gga 7218 
Phe Pro Phe Val Asp Val Gly Val Ser Ala Leu Leu Leu Ala Ala Gly 
2360 2365 2370 

tgc tgg gga caa gtc acc etc acc gtt acg gta aca gcg gca aca etc 7266 
Cys Trp Gly Gin Val Thr Leu Thr Val Thr Val Thr Ala Ala Thr Leu 
2375 2380 2385 2390 

ctt ttt tgc cac tat gee tac atg gtt ccc ggt tgg caa get gag gca 7314 
Leu Phe Cys His Tyr Ala Tyr Met Val Pro Gly Trp Gin Ala Glu Ala 
2395 2400 2405 

atg cgc tea gee cag egg egg aca gcg gee gga ate atg aaa aac get 7362 
Met Arg Ser Ala Gin Arg Arg Thr Ala Ala Gly He Met Lys Asn Ala 
2410 2415 2420 

gta gtg gat ggc ate gtg gee acg gac gtc cca gaa tta gag cgc acc 7410 
Val Val Asp Gly lie Val Ala Thr Asp Val Pro Glu Leu Glu Arg Thr 
2425 2430 2435 

aca ccc ate atg cag aag aaa gtt gga cag ate atg ctg ate ttg gtg 7458 
Thr Pro He Met Gin Lys Lys Val Gly Gin He Met Leu He Leu Val 
2440 2445 2450 

tct eta get gca gta gta gtg aac ccg tct gtg aag aca gta cga gaa 7506 
Ser Leu Ala Ala Val Val Val Asn Pro Ser Val Lys Thr Val Arg Glu 
2455 2460 2465 ~ 2470 

gee gga att ttg ate acg gec gca gcg gtg acg ctt tgg gag aat gga 7554 
Ala Gly He Leu He Thr Ala Ala Ala Val Thr Leu Trp Glu Asn Gly 
2475 2480 2485 

gca age tct gtt tgg aac gca aca act gee ate gga etc tgc cac ate 7602 
Ala Ser Ser Val Trp Asn Ala Thr Thr Ala He Gly Leu Cys His He 
2490 2495 2500 

atg cgt ggg ggt tgg ttg tea tgt eta tec ata aca tgg aca etc ata ■ 7650 
Met Arg Gly Gly Trp Leu Ser Cys Leu Ser He Thr Trp Thr Leu He 
2505 2510 2515 

aag aac atg gaa aaa cca gga eta aaa aga ggt ggg gca aaa gga cgc 7698 
Lys Asn Met Glu Lys Pro Gly Leu Lys Arg Gly Gly Ala Lys Gly Arg 
2520 2525 2530 

acc ttg gga gag gtt tgg aaa gaa aga etc aac cag atg aca aaa gaa 7746 
Thr Leu Gly Glu Val Trp Lys Glu Arg Leu Asn Gin Met Thr Lys Glu 
2535 2540 2545 2550 

gag ttc act agg tac ■ cgc aaa gag gee ate ate gaa gtc gat cgc tea 7794 
Glu Phe Thr Arg Tyr Arg Lys Glu Ala He He Glu Val Asp Arg Ser 
2555 2560 2565 
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gcg gca aaa cac gcc agg aaa gaa ggc aat gtc act gga ggg cat tea 784 2 
Ala Ala Lys His Ala Arg Lys Glu Gly Asn Val Thr Gly Gly His Ser 
2570 2575 2580 

gtc tct agg ggc aca gca aaa ctg aga tgg ctg gtc gaa egg agg ttt 7890 
Val Ser Arg Gly Thr Ala Lys Leu Arg Trp Leu Val Glu Arg Arg Phe 
2585 2590 2595 

etc gaa ccg gtc gga aaa gtg att gac ctt gga tgt gga aga ggc ggt 793 8 
Leu Glu Pro Val Gly Lys Val He Asp Leu Gly Cys Gly Arg Gly Gly 
2600 2605 2610 

tgg tgt tac tat atg gca ace caa aaa aga gtc caa gaa gtc aga ggg 7986 
Trp Cys Tyr Tyr Met Ala Thr Gin Lys Arg Val Gin Glu Val Arg Gly 
2615 2620 2625 2630 

tac aca aag ggc ggt ccc gga cat gaa gag ccc caa eta gtg caa agt 8034 
Tyr Thr Lys Gly Gly Pro Gly His Glu Glu Pro Gin Leu Val Gin Ser 
2635 2640 2645 

tat gga tgg aac att gtc acc atg aag agt gga gtg gat gtg ttc tac 80 82 
Tyr Gly Trp Asn He Val Thr Met Lys Ser Gly Val Asp Val Phe Tyr 
2650 2655 2660 

aga cct tct gag tgt tgt gac acc etc ctt tgt gac ate gga gag tec 813 0 
Arg Pro Ser Glu Cys Cys Asp Thr Leu Leu Cys Asp He Gly Glu Ser 
2665 2670 2675 

teg tea agt get gag gtt gaa gag cat agg acg att cgt gtc ctt gaa 8178 
Ser Ser Ser Ala Glu Val Glu Glu His Arg Thr He Arg Val Leu Glu 
2680 2685 2690 

atg gtt gag gac tgg ctg cac cga ggg cca agg gaa ttt tgc gtg aag 8226 
Met Val Glu Asp Trp Leu His Arg Gly Pro Arg Glu Phe Cys Val Lys 
2695 2700 2705 2710 

gtg etc tgc ccc tac atg ccg aaa gtc ata gag aag atg gag ctg etc 8274 
Val Leu Cys Pro Tyr Met Pro Lys Val He Glu Lys Met Glu Leu Leu 
2715 2720 2725 

caa cgc egg tat ggg ggg gga ctg gtc aga aac cca etc tea egg aat 8322 
Gin Arg Arg Tyr Gly Gly Gly Leu Val Arg Asn Pro Leu Ser Arg Asn 
2730 2735 2740 

tec acg cac gag atg tat tgg gtg agt cga get tea ggc aat gtg gta 8370 
Ser Thr His Glu Met Tyr Trp Val Ser Arg Ala Ser Gly Asn Val Val 
2745 2750 2755 

cat tea gtg aat atg acc age cag gtg etc eta gga aga atg gaa aaa 8418 
His Ser Val Asn Met Thr Ser Gin Val Leu Leu Gly Arg Met Glu Lys 
2760 2765 2770 

agg acc tgg aag gga ccc caa tac gag gaa gat gta aac ttg gga age 8466 
Arg Thr Trp Lys Gly Pro Gin Tyr Glu Glu Asp Val Asn Leu Gly Ser 
2775 2780 2785 2790 



2823218 
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gga acc agg gcg gtg gga aaa ccc ctg etc aac tea gac ace agt aaa 
Gly Thr Arg Ala Val Gly Lys Pro Leu Leu Asn Ser Asp Thr Ser Lys 
2795 2800 2805 



8514 



ate aac aac agg att gaa cga etc agg cgt gag tac agt teg acg tgg 
He Asn Asn Arg He Glu Arg Leu Arg Arg Glu Tyr Ser Ser Thr Trp 
2810 2815 2820 



8562 



cac cac gat gag aac cac cca tat aga acc tgg aac tat cac ggc agt 
His His Asp Glu Asn His Pro Tyr Arg Thr Trp Asn Tyr His Gly Ser 
2825 2830 2835 



8610 



tat gat gtg aag ccc aca ggc tec gee agt teg ctg gtc aat gga gtg 
Tyr Asp Val Lys Pro Thr Gly Ser Ala Ser Ser Leu Val Asn Gly Val 
2840 2845 2850 



8658 



gtc agg etc etc tea aaa cca tgg gac acc ate acg aat gtt acc acc 
Val Arg Leu Leu Ser Lys Pro Trp Asp Thr He Thr Asn Val Thr Thr 
2855 2860 2865 2870 



8706 



atg gee atg act gac act act ccc ttc ggg cag cag cga gtg ttc aaa 
Met Ala Met Thr Asp Thr Thr Pro Phe Gly Gin Gin Arg Val Phe Lys 
2875 2880 ~ 2885 



8754 



gag aag gtg gac acg aaa get cct gaa ccg cca gaa gga gcg aag tac 
Glu Lys Val Asp Thr Lys Ala Pro Glu Pro Pro Glu Gly Ala Lys Tyr 
2890 2895 2900 



8802 



gtg etc aac gag acc acc aac tgg ttg tgg gcg ttt ttg gee aga gaa 
Val Leu Asn Glu Thr Thr Asn Trp Leu Trp Ala Phe Leu Ala Arg Glu 
2905 2910 2915 



8850 



aaa cgt ccc aga atg tgc tct cga gag gaa ttc ata aga aag gtc aac 
Lys Arg Pro Arg Met Cys Ser Arg Glu Glu Phe He Arg Lys Val Asn 
2920 2925 2930 



8898 



age aat gca get ttg ggt gee atg ttt gaa gag cag aat caa tgg agg 
Ser Asn Ala Ala Leu Gly Ala Met Phe Glu Glu Gin Asn Gin Trp Arg 
2935 2940 2945 2950 



8946 



age gee aga gaa gca gtt gaa gat cca aaa ttt tgg gag atg gtg gat 
Ser Ala Arg Glu Ala Val Glu Asp Pro Lys Phe Trp Glu Met Val Asp 
2955 2960 2965 



8994 



gag gag cgc gag gca cat ctg egg ggg gaa tgt cac act tgc att tac 
Glu Glu Arg Glu Ala His Leu Arg Gly Glu Cys His Thr Cys lie Tyr 
2970 2975 2980 



9042 



aac atg atg gga aag aga gag aaa aaa ccc gga gag ttc gga aag gec 9090 
Asn Met Met Gly Lys Arg Glu Lys Lys Pro Gly Glu Phe Gly Lys Ala 
2985 2990 2995 

aag gga age aga gec att tgg ttc atg tgg etc gga get cgc ttt ctg 9138 
Lys Gly Ser Arg Ala He Trp Phe Met Trp Leu Gly Ala Arg Phe Leu 
3000 * 3005 3010 



# 
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gag tec gag get ctg ggt ttt etc aat gaa gac cac tgg ctt gga aga 9186 
Glu Phe Glu Ala Leu Gly Phe Leu Asn Glu Asp His Trp Leu Gly Arg 
3015 3020 3025 3030 

aag aac tea gga gga ggt gtc gag ggc ttg ggc etc caa aaa ctg ggt 9234 
Lys Asn Ser Gly Gly Gly Val Glu Gly Leu Gly Leu Gin Lys Leu Gly 
3035 3040 3045 

tac ate ctg cgt gaa gtt ggc ace egg cct ggg ggc aag ate tat get 9282 
Tyr He Leu Arg Glu Val Gly Thr Arg Pro Gly Gly Lys He Tyr Ala 
3050 3055 3060 

gat gac aca get ggc tgg gac acc cgc ate acg aga get gac ttg gaa 933 0 
Asp Asp Thr Ala Gly Trp Asp Thr Arg He Thr Arg Ala Asp Leu Glu 
3065 3070 3075 

aat gaa get aag gtg ctt gag ctg ctt gat ggg gaa cat egg cgt ctt 9378 
Asn Glu Ala Lys Val Leu Glu Leu Leu Asp Gly Glu His Arg Arg Leu 
3080 3085 3090 

gec agg gec ate att gag etc acc tat cgt cac aaa gtt gtg aaa gtg 9426 
Ala Arg Ala He He Glu Leu Thr Tyr Arg His Lys Val Val Lys Val 
3095 3100 3105 " 3110 

atg cgc ccg get get gat gga aga acc gtc atg gat gtt ate tec aga 9474 
Met Arg Pro Ala Ala Asp Gly Arg Thr Val Met Asp Val He Ser Arg 
3115 3120 3125 

gaa gat cag agg ggg agt gga caa gtt gtc acc tac gee eta aac act 9522 
Glu Asp Gin Arg Gly Ser Gly Gin Val Val Thr Tyr Ala Leu Asn Thr 
3130 3135 3140 

ttc acc aac ctg gee gtc cag ctg gtg agg atg atg gaa ggg gaa gga 9570 
Phe Thr Asn Leu Ala Val Gin Leu Val Arg Met Met Glu Gly Glu Gly 
3145 3150 3155 

gtg att ggc cca gat gat gtg gag aaa etc aca aaa ggg aaa gga ccc 9618 
Val He Gly Pro Asp Asp Val Glu Lys Leu Thr Lys Gly Lys Gly Pro 
3160 3165 3170 

aaa gtc agg acc tgg ctg ttt gag aat ggg gaa gaa aga etc age cgc 9666 
Lys Val Arg Thr Trp Leu Phe Glu Asn Gly Glu Glu Arg Leu Ser Arg 
3175 3180 3185 " 3190 

atg get gtc agt gga gat gac tgt gtg gta aag ccc ctg gac gat cgc 9714 
Met Ala Val Ser Gly Asp Asp Cys Val Val Lys Pro Leu Asp Asp Arg 
3195 3200 3205 

ttt gee acc teg etc cac ttc etc aat get atg tea aag gtt cgc aaa 9762 
Phe Ala Thr Ser Leu His Phe Leu Asn Ala Met Ser Lys Val Arg Lys 
3210 3215 3220 

gac ate caa gag tgg aaa ccg tea act gga tgg tat gat tgg cag cag 9810 
Asp He Gin Glu Trp Lys Pro Ser Thr Gly Trp Tyr Asp Trp Gin Gin 
3225 3230 3235 



m 



m 



2823218 



16 



gtt cca ttt tgc tea aac cat ttc act gaa ttg ate atg aaa gat gga 9858 
Val Pro Phe Cys Ser Asn His Phe Thr Glu Leu He Met Lys Asp Gly 
3240 3245 3250 

aga aca ctg gtg gtt cca tgc cga gga cag gat gaa ttg gta ggc aga 9 906 
Arg Thr Leu Val Val Pro Cys Arg Gly Gin Asp Glu Leu Val Gly Arg 
3255 3260 3265 3270 

get cgc ata tct cca ggg gec gga tgg aac gtc cgc gac act get tgt 9954 
Ala Arg lie Ser Pro Gly Ala Gly Trp Asn Val Arg Asp Thr Ala Cys 
3275 3280 3285 

ctg get aag tct tat gee cag atg tgg ctg ctt ctg tac ttc cac aga 10002 
Leu Ala Lys Ser Tyr Ala Gin Met Trp Leu Leu Leu Tyr Phe His Arg 
3290 3295 3300 

aga gac ctg egg etc atg gee aac gee att tgc tec get gtc cct gtg 10050 
Arg Asp Leu Arg Leu Met Ala Asn Ala He Cys Ser Ala Val Pro Val 
3305 3310 3315 

aat tgg gtc cct ace gga aga acc acg tgg tec ate cat gca gga gga 10098 
Asn Trp Val Pro Thr Gly Arg Thr Thr Trp Ser He His Ala Gly Gly 
3320 3325 3330 

gag tgg atg aca aca gag gac atg ttg gag gtc tgg aac cgt gtt tgg 10146 
Glu Trp Met Thr Thr Glu Asp Met Leu Glu Val Trp Asn Arg Val Trp 
3335 3340 3345 " 3350 

ata gag gag aat gaa tgg atg gaa gac aaa acc cca gtg gag aaa tgg 10194 
He Glu Glu Asn Glu Trp Met Glu Asp Lys Thr Pro Val Glu Lys Trp 
3355 3360 3365 

agt gac gtc cca tat tea gga aaa cga gag gac ate tgg tgt ggc age 10242 
Ser Asp Val Pro Tyr Ser Gly Lys Arg Glu Asp He Trp Cys Gly Ser 
3370 3375 3380 

ctg att ggc aca aga gee cga gee acg tgg gca gaa aac ate cag gtg 10290 
Leu He Gly Thr Arg Ala Arg Ala Thr Trp Ala Glu Asn lie Gin Val 
3385 3390 3395 

get ate aac caa gtc aga gca ate ate gga gat gag aag tat gtg gat 1033 8 
Ala He Asn Gin Val Arg Ala lie lie Gly Asp Glu Lys Tyr Val Asp 
3400 3405 3410 

tac atg agt tea eta aag aga tat gaa gac aca act ttg gtt gag gac 10386 
Tyr Met Ser Ser Leu Lys Arg Tyr Glu Asp Thr Thr Leu Val Glu Asp 
3415 3420 3425 3430 

aca gta ctg tagatattta atcaat.tgta aatagacaat ataagtatgc 10435 
Thr Val Leu 

ataaaagtgt agttttatag tagtatttag tggtgttagt gtaaatagtt aagaaaattt 10495 
tgaggagaaa gtcaggcegg gaagttcccg ccaccggaag ttgagtagac ggtgctgcct 10555 
gcgactcaac cccaggagga ctgggtgaac aaagecgega agtgatccat gtaagccctc 10615 
agaacegtet eggaaggagg accccacatg ttgtaacttc aaagcccaat gtcagaccac 10675 
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gctacggcgt gctactctgc ggagagtgca gtctgcgata gtgccccagg aggactgggt 10735 
taacaaaggc aaaccaacgc cccacgcggc cctagccccg gtaatggtgt taaccagggc 107 95 
gaaaggacta gaggttagag gagaccccgc ggtttaaagt gcacggccca gcctgactga 10855 
agctgtaggt caggggaagg actagaggtt agtggagacc ccgtgccaca aaacaccaca 10915 
acaaaacagc atattgacac ctgggataga ctaggagatc ttctgctctg cacaaccagc 10975 
cacacggcac agtgcgccga caatggtggc tggtggtgcg agaacacagg atct 11029 

<210> 2 
<211> 3433 
<212> PRT 

<213> Flavivirus sp. 
<400> 2 

Met Ser Lys Lys Pro Gly Gly Pro Gly Lys Ser Arg Ala Val Asn Met 
15 10 15 

Leu Lys Arg Gly Met Pro Arg Val Leu Ser Leu He Gly Leu Lys Arg 
20 25 30 

Ala Met Leu Ser Leu He Asp Gly Lys Gly Pro He Arg Phe Val Leu 
35 40 45 

Ala Leu Leu Ala Phe Phe Arg Phe Thr Ala lie Ala Pro Thr Arg Ala 
50 55 60 

Val Leu Asp Arg Trp Arg Gly Val Asn Lys Gin Thr Ala Met Lys His 
65 70 75 80 

Leu Leu Ser Phe Lys Lys Glu Leu Gly Thr Leu Thr Ser Ala He Asn 
85 90 95 

Arg Arg Ser Ser Lys Gin Lys Lys Arg Gly Gly Lys Thr Gly He Ala 
100 105 HO 

Val Met He Gly Leu He Ala Ser Val Gly Ala Val Thr Leu Ser Asn 
115 120 125 

Phe Gin Gly Lys Val Met Met Thr Val Asn Ala Thr Asp Val Thr Asp 
130 135 140 

Val He Thr He Pro Thr Ala Ala Gly Lys Asn Leu Cys lie Val Arg 
145 150 155 160 

Ala Met Asp Val Gly Tyr Met Cys Asp Asp Thr He Thr Tyr Glu Cys 
165 170 175 

Pro Val Leu Ser Ala Gly Asn Asp Pro Glu Asp He Asp Cys Trp Cys 
180 185 190 

Thr Lys Ser Ala Val Tyr Val Arg Tyr Gly Arg Cys Thr Lys Thr Arg 
195 200 205 



# 
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His Ser Arg Arg Ser Arg Arg Ser Leu Thr Val Gin Thr His Gly Glu 
210 215 220 

Ser Thr Leu Ala Asn Lys Lys Gly Ala Trp Met Asp Ser Thr Lys Ala 
225 230 235 240 

Thr Arg Tyr Leu Val Lys Thr Glu Ser Trp lie Leu Arg Asn Pro Gly 
245 250 ~ 255 

Tyr Ala Leu Val Ala Ala Val He Gly Trp Met Leu Gly Ser Asn Thr 
260 265 270 

Met Gin Arg Val Val Phe Val Val Leu Leu Leu Leu Val Ala Pro Ala 
275 280 285 

Tyr Ser Phe Asn Cys Leu Gly Met Ser Asn Arg Asp Phe Leu Glu Gly 
290 295 300 

Val Ser Gly Ala Thr Trp Val Asp Leu Val Leu Glu Gly Asp Ser Cys 
305 310 315 320 

Val Thr He Met Ser Lys Asp Lys Pro Thr He Asp Val Lys Met Met 
325 330 335 

Asn Met Glu Ala Ala Asn Leu Ala Glu Val Arg Ser Tyr Cys Tyr Leu 
340 345 350 

Ala Thr Val Ser Asp Leu Ser Thr Lys Ala Ala Cys Pro Thr Met Gly 
355 360 365 

Glu Ala His Asn Asp Lys Arg Ala Asp Pro Ala Phe Val Cys Arg Gin 
370 375 380 

Gly Val Val Asp Arg Gly Trp Gly Asn Gly Cys Gly Leu Phe Gly Lys 
385 390 395 * 400 

Gly Ser He Asp Thr Cys Ala Lys Phe Ala Cys Ser Thr Lys Ala He 
405 410 " 415 

Gly Arg Thr He Leu Lys Glu Asn He Lys Tyr Glu Val Ala He Phe 
420 425 430 

Val His Gly Pro Thr Thr Val Glu Ser His Gly Asn Tyr Ser Thr Gin 
435 440 ' 445 

Val Gly Ala Thr Gin Ala Gly Arg Phe Ser He Thr Pro Ala Ala Pro 
450 455 460 

Ser Tyr Thr Leu Lys Leu Gly Glu Tyr Gly Glu Val Thr Val Asp Cys 
465 470 475 480 

Glu Pro Arg Ser Gly He Asp Thr Asn Ala Tyr Tyr Val Met Thr Val 
485 490 495 



Gly Thr Lys Thr Phe Leu Val His Arg Glu Trp Phe Met Asp Leu Asn 
500 505 510 
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Leu Pro Trp Ser Ser Ala Gly Ser Thr Val Trp Arg Asn Arg Glu Thr 
515 520 525 

Leu Met Glu Phe Glu Glu Pro His Ala Thr Lys Gin Ser Val He Ala 
530 535 540 

Leu Gly Ser Gin Glu Gly Ala Leu His Gin Ala Leu Ala Gly Ala He 
545 550 555 560 

Pro Val Glu Phe Ser Ser Asn Thr Val Lys Leu Thr Ser Gly His Leu 
565 570 575 

Lys Cys Arg Val Lys Met Glu Lys Leu Gin Leu Lys Gly Thr Thr Tyr 
580 585 J ■ 590 

Gly Val Cys Ser Lys Ala Phe Lys Phe Leu Gly Thr Pro Ala Asp Thr 
595 600 605 

Gly His Gly Thr Val Val Leu Glu Leu Gin Tyr Thr Gly Thr Asp Gly 
610 615 620 

Pro Cys Lys Val Pro He Ser Ser Val Ala Ser Leu Asn Asp Leu Thr 
625 630 635 640 

Pro Val Gly Arg Leu Val Thr Val Asn Pro Phe Val Ser Val Ala Thr 
645 650 655 

Ala Asn Ala Lys Val Leu He Glu Leu Glu Pro Pro Phe Gly Asp Ser 
660 665 670 

Tyr He Val Val Gly Arg Gly Glu Gin Gin He Asn His His Trp His 
675 680 685 

Lys Ser Gly Ser Ser He Gly Lys Ala Phe Thr Thr Thr Leu Lys Gly 
690 695 700 

Ala Gin Arg Leu Ala Ala Leu Gly Asp Thr Ala Trp Asp Phe Gly Ser 
705 710 715 * 720 

Val Gly Gly Val Phe Thr Ser Val Gly Lys Ala Val His Gin Val Phe 
725 730 735 

Gly Gly Ala Phe Arg Ser Leu Phe Gly Gly Met Ser Trp He Thr Gin 
740 745 750 

Gly Leu Leu Gly Ala Leu Leu Leu Trp Met Gly He Asn Ala Arg Asp 
755 760 765 

Arg Ser lie Ala Leu Thr Phe Leu Ala Val Gly Gly Val Leu Leu Phe 
770 775 780 

Leu Ser Val Asn Val His Ala Asp Thr Gly Cys Ala He Asp He Ser 
785 790 795 " 800 

Arg Gin Glu Leu Arg Cys Gly Asn Gly Val Phe He His Asn Asp Val 
805 810 815 
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Glu Ala Trp Met Asp Arg Tyr Lys Tyr Tyr Pro Glu Thr Pro Gin Gly 
820 825 830 

Leu Ala Lys He He Gin Lys Ala His Lys Glu Gly Val Cys Gly Leu 
835 840 845 

Arg Ser Val Ser Arg Leu Glu His Gin Met Trp Glu Ala Val Lys Asp 
850 855 " 860 

Glu Leu Asn Thr Leu Leu Lys Glu Asn Gly Val Asp Leu Ser Val Val 
865 870 875 880 

Val Glu Lys Gin Glu Gly Met Tyr Lys Ser Ala Pro Lys Arg Leu Thr 
885 890 895 

Ala Thr Thr Glu Lys Leu Glu He Gly Trp Lys Ala Trp Gly Lys Ser 
900 905 910 

He Leu Phe Ala Pro Glu Leu Ala Asn Asn Thr Phe Val Val Asp Gly 
915 920 925 

Pro Glu Thr Lys Glu Cys Pro Thr Gin Asn Arg Ala Trp Asn Ser Leu 
930 935 940 

Glu Val Glu Asp Phe Gly Phe Gly Leu Thr Ser Thr Arg Met Phe Leu 
945 950 955 960 

Lys Val Arg Glu Ser Asn Thr Thr Glu Cys Asp Ser Lys He lie Gly 
965 970 * 975 

Thr Ala Val Lys Asn Asn Leu Ala He His Ser Asp Leu Ser Tyr Trp 
980 985 990 

He Glu Ser Arg Leu Asn Asp Thr Trp Lys Leu Glu Arg Ala Val Leu 
995 1000 1005 

Gly Glu Val Lys Ser Cys Thr Trp Pro Glu Thr His Thr Leu Trp Gly 
1010 1015 1020 

Asp Gly He Leu Glu Ser Asp Leu He He Pro Val Thr Leu Ala Gly 
025 1030 1035 1040 

Pro Arg Ser Asn His Asn Arg Arg Pro Gly Tyr Lys Thr Gin Asn Gin 
1045 1050 1055 

Gly Pro Trp Asp Glu Gly Arg Val Glu He Asp Phe Asp Tyr Cys Pro 
1060 1065 1070 

Gly Thr Thr Val Thr Leu Ser Glu Ser Cys Gly His Arg Gly Pro Ala 
1075 1080 * 1085 

Thr Arg Thr Thr Thr Glu Ser Gly Lys Leu He Thr Asp Trp Cys Cys 
1090 1095 1100 

Arg Ser Cys Thr Leu Pro Pro Leu Arg Tyr Gin Thr Asp Ser Gly Cys 
105 1110 ins H20 
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Trp Tyr Gly Met Glu lie Arg Pro Gin Arg His Asp Glu Lys Thr Leu 
1125 H30 H35 

Val Gin Ser Gin Val Asn Ala Tyr Asn Ala Asp Met lie Asp Pro Phe 
1140 H45 1150 

Gin Leu Gly Leu Leu Val Val Phe Leu Ala Thr Gin Glu Val Leu Arg 
1155 1160 H65 

Lys Arg Trp Thr Ala Lys lie Ser Met Pro Ala He Leu He Ala Leu 
1170 H75 1180 

Leu Val Leu Val Phe Gly Gly He Thr Tyr Thr Asp Val Leu Arg Tyr 
185 1190 H95 1200 

Val He Leu Val Gly Ala Ala Phe Ala Glu Ser Asn Ser Gly Gly Asp 
1205 1210 1215 

Val Val His Leu Ala Leu Met Ala Thr Phe Lys lie Gin Pro Val Phe 
1220 1225 1230 

Met Val Ala Ser Phe Leu Lys Ala Arg Trp Thr Asn Gin Glu Asn He 
1235 1240 1245 

Leu Leu Met Leu Ala Ala Val Phe Phe Gin Met Ala Tyr His Asp Ala 
1250 1255 1260 

Arg Gin He Leu Leu Trp Glu He Pro Asp Val Leu Asn Ser Leu Ala 
265 1270 1275 1280 

Val Ala Trp Met He Leu Arg Ala He Thr Phe Thr Thr Thr Ser Asn 
1285 1290 1295 

Val Val Val Pro Leu Leu Ala Leu Leu Thr Pro Arg Leu Arg Cys Leu 
1300 1305 1310 

Asn Leu Asp Val Tyr Arg He Leu Leu Leu Met Val Gly He Gly Ser 
1315 1320 1325 

Leu He Arg Glu Lys Arg Ser Ala Ala Ala Lys Lys Lys Gly Ala Ser 
1330 1335 1340 

Leu Leu Cys Leu Ala Leu Ala Ser Thr Gly Leu Phe Asn Pro Met He 
345 1350 1355 1360 

Leu Ala Ala Gly Leu He Ala Cys Asp Pro Asn Arg Lys Arg Gly Trp 
1365 1370 1375 

Pro Ala Thr Glu Val Met Thr Ala Val Gly Leu Met Phe Ala lie Val 
1380 1385 1390 

Gly Gly Leu Ala Glu Leu Asp lie Asp Ser Met Ala He Pro Met Thr 
1395 1400 1405 

lie Ala Gly Leu Met Phe Ala Ala Phe Val lie Ser Gly Lys Ser Thr 
1410 1415 1420 



* • 
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Asp Met Trp He Glu Arg Thr Ala Asp He Ser Trp Glu Ser Asp Ala 
425 1430 1435 1440 

Glu He Thr Gly Ser Ser Glu Arg Val Asp Val Arg Leu Asp Asp Gly 
1445 1450 1455 

Glu Asn Phe Gin Leu Met Asn Asp Pro Gly Ala Pro Trp Lys He Trp 
1460 1465 1470 

Met Leu Arg Met Val Cys Leu Ala He Ser Ala Tyr Thr Pro Trp Ala 
1475 1480 1485 

He Leu Pro Ser Val Val Gly Phe Trp He Thr Leu Gin Tyr Thr Lys 
1490 1495 1500 

Arg Gly Gly Val Leu Trp Asp Thr Pro Ser Pro Lys Glu Tyr Lys Lys 
505 1510 1515 1520 

Gly Asp Thr Thr Thr Gly Val Tyr Arg He Met Thr Arg Gly Leu Leu 
1525 1530 1535 

Gly Ser Tyr Gin Ala Gly Ala Gly Val Met Val Glu Gly Val Phe His 
1540 1545 1550 

Thr Leu Trp His Thr Thr Lys Gly Ala Ala Leu Met Ser Gly Glu Gly 
1555 1560 1565 

Arg Leu Asp Pro Tyr Trp Gly Ser Val Lys Glu Asp Arg Leu Cys Tyr 
1570 1575 1580 

Gly Gly Pro Trp Lys Leu Gin His Lys Trp Asn Gly Gin Asp Glu Val 
585 1590 1595 * ~ 1600 

Gin Met He Val Val Glu Pro Gly Lys Asn Val Lys Asn Val Gin Thr 
1605 1610 1615 

Lys Pro Gly Val Phe Lys Thr Pro Glu Gly Glu He Gly Ala Val Thr 
1620 1625 1630 

Leu Asp Phe Pro Thr Gly Thr Ser Gly Ser Pro lie Val Asp Lys Asn 
1635 1640 1645 

Gly Asp Val He Gly Leu Tyr Gly Asn Gly Val He Met Pro Asn Gly 
1650 1655 1660 

Ser Tyr He Ser Ala He Val Gin Gly Glu Arg Met Asp Glu Pro He 
665 1670 1675 1680 . 

Pro Ala Gly Phe Glu Pro Glu Met Leu Arg Lys Lys Gin He Thr Val 
1685 1690 1695 

Leu Asp Leu His Pro Gly Ala Gly Lys Thr Arg Arg lie Leu Pro Gin 
1700 1705 ~ 1710 

He lie Lys Glu Ala lie Asn Arg Arg Leu Arg Thr Ala Val Leu Ala 
1715 1720 1725 



• 
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Pro Thr Arg Val Val Ala Ala Glu Met Ala Glu Ala Leu Arg Gly Leu 
1730 1735 1740 

Pro He Arg Tyr Gin Thr Ser Ala Val Pro Arg Glu His Asn Gly Asn 
745 1750 1755 1760 

Glu He Val Asp Val Met Cys His Ala Thr Leu Thr His Arg Leu Met 
1765 1770 1775 

Ser Pro His Arg Val Pro Asn Tyr Asn Leu Phe Val Met Asp Glu Ala 
1780 1785 1790 

His Phe Thr Asp Pro Ala Ser He Ala Ala Arg Gly Tyr He Ser Thr 
1795 1800 1805 

Lys Val Glu Leu Gly Glu Ala Ala Ala lie Phe Met Thr Ala Thr Pro 
1810 1815 1820 

Pro Gly Thr Ser Asp Pro Phe Pro Glu Ser Asn Ser Pro He Ser Asp 
825 1830 1835 1840 

Leu Gin Thr Glu He Pro Asp Arg Ala Trp Asn Ser Gly Tyr Glu Trp 
1845 1850 1855 

lie Thr Glu Tyr Thr Gly Lys Thr Val Trp Phe Val Pro Ser Val Lys 
1860 1865 1870 

Met Gly Asn Glu He Ala Leu Cys Leu Gin Arg Ala Gly Lys Lys Val 
1875 1880 1885 

Val Gin Leu Asn Arg Lys Ser Tyr Glu Thr Glu Tyr Pro Lys Cys Lys 
1890 1895 1900 

Asn Asp Asp Trp Asp Phe Val He Thr Thr Asp He Ser Glu Met Gly 
905 1910 1915 1920 

Ala Asn Phe Lys Ala Ser Arg Val He Asp Ser Arg Lys Ser Val Lys 
1925 1930 1935 

Pro Thr He He Thr Glu Gly. Glu Gly Arg Val He Leu Gly Glu Pro 
1940 1945 1950 

Ser Ala Val Thr Ala Ala Ser Ala Ala Gin Arg Arg Gly Arg He Gly 
1955 I960 1965 

Arg Asn Pro Ser Gin Val Gly Asp Glu Tyr Cys Tyr Gly Gly His Thr 
1970 1975 1980 

Asn Glu Asp Asp Ser Asn Phe Ala His Trp Thr Glu Ala Arg lie Met 
985 1990 1995 " 2000 

Pro Asp Asn He Asn Met Pro Asn Gly Leu lie Ala Gin Phe Tyr Gin 
2005 2010 2015 

Pro Glu Arg Glu Lys Val Tyr Thr Met Glu Gly Glu Tyr Arg Leu Arg 
2020 2025 2030 



* 
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Gly Glu Glu Arg Lys Asn Phe Leu Glu Leu Leu Arg Thr Ala Asp Leu 
2035 2040 2045 

Pro Val Trp Leu Ala Tyr Lys Val Ala Ala Ala Gly Val Ser Tyr His 
2050 2055 2060 

Asp Arg Arg Trp Cys Phe Asp Gly Pro Arg Thr Asn Thr lie Leu Glu 
065 2070 2075 2080 

Asp Asn Asn Glu Val Glu Val lie Thr Lys Leu Gly Glu Arg Lys lie 
2085 2090 2095 

Leu Arg Pro Arg Trp lie Asp Ala Arg Val Tyr Ser Asp His Gin Ala 
2100 2105 2110 

Leu Lys Ala Phe Lys Asp Phe Ala Ser Gly Lys Arg Ser Gin lie Gly 
2115 2120 2125 

Leu lie Glu Val Leu Gly Lys Met Pro Glu His Phe Met Gly Lys Thr 
2130 2135 2140 

Trp Glu Ala Leu Asp Thr Met Tyr Val Val Ala Thr Ala Glu Lys Gly 
145 2150 2155 2160 

Gly Arg Ala His Arg Met Ala Leu Glu Glu Leu Pro Asp Ala Leu Gin 
2165 2170 2175 . 

Thr lie Ala Leu He Ala Leu Leu Ser Val Met Thr Met Gly Val Phe 
2180 2185 2190 

Phe Leu Leu Met Gin Arg Lys Gly He Gly Lys He Gly Leu Gly Gly 
2195 2200 2205 

Ala Val Leu Gly Val Ala Thr Phe Phe Cys Trp Met Ala Glu Val Pro 
2210 2215 2220 

Gly Thr Lys He Ala Gly Met Leu Leu Leu Ser Leu Leu Leu Met He 
225 2230 2235 2240 

Val Leu He Pro Glu Pro Glu Lys Gin Arg Ser Gin Thr Asp Asn Gin 
2245 2250 2255 

Leu Ala Val Phe Leu He Cys Val Met Thr Leu Val Ser Ala Val Ala 
2260 2265 2270 

Ala Asn Glu Met Gly Trp Leu Asp Lys Thr Lys Ser Asp He Ser Ser 
2275 2280 2285 

Leu Phe Gly Gin Arg lie Glu Val Lys Glu Asn Phe Ser Met Gly Glu 
2290 2295 2300 

Phe Leu Leu Asp Leu Arg Pro Ala Thr Ala Trp Ser Leu Tyr Ala Val 
305 2310 2315 2320 

Thr Thr Ala Val Leu Thr Pro Leu Leu Lys His Leu He Thr Ser Asp 
2325 2330 2335 



* 
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Tyr He Asn Thr Ser Leu Thr Ser He Asn Val Gin Ala Ser Ala Leu 
2340 2345 2350 

Phe Thr Leu Ala Arg Gly Phe Pro Phe Val Asp Val Gly Val Ser Ala 
2355 2360 2365 

Leu Leu Leu Ala Ala Gly Cys Trp Gly Gin Val Thr Leu Thr Val Thr 
2370 2375 2380 

Val Thr Ala Ala Thr Leu Leu Phe Cys His Tyr Ala Tyr Met Val Pro 
385 2390 2395 2400 

Gly Trp Gin Ala Glu Ala Met Arg Ser Ala Gin Arg Arg Thr Ala Ala 
2405 2410 2415 

Gly He Met Lys Asn Ala Val Val Asp Gly lie Val Ala Thr Asp Val 
2420 2425 2430 

Pro Glu Leu Glu Arg Thr Thr Pro He Met Gin Lys Lys Val Gly Gin 
2435 2440 2445 

lie Met Leu He Leu Val Ser Leu Ala Ala Val Val Val Asn Pro Ser 
2450 2455 2460 

Val Lys Thr Val Arg Glu Ala Gly He Leu He Thr Ala Ala Ala Val 
465 2470 2475 2480 

Thr Leu Trp Glu Asn Gly Ala Ser Ser Val Trp Asn Ala Thr Thr Ala 
2485 2490 2495 

lie Gly Leu Cys His lie Met Arg Gly Gly Trp Leu Ser Cys Leu Ser 
2500 2505 2510 

lie Thr Trp Thr Leu lie Lys Asn Met Glu Lys Pro Gly Leu Lys Arg 
2515 2520 2525 

Gly Gly Ala Lys Gly Arg Thr Leu Gly Glu Val Trp Lys Glu Arg Leu 
2530 2535 2540 

Asn Gin Met Thr Lys Glu Glu Phe Thr Arg Tyr Arg Lys Glu Ala He 
545 2550 2555 " " 2560 

lie Glu Val Asp Arg Ser Ala Ala Lys His Ala Arg Lys Glu Gly Asn 
2565 2570 2575 

Val Thr Gly Gly His Ser Val Ser Arg Gly Thr Ala Lys Leu Arg Trp 
2580 2585 2590 

Leu Val Glu Arg Arg Phe Leu Glu Pro Val Gly Lys Val lie Asp Leu 
2595 2600 2605 

Gly Cys Gly Arg Gly Gly Trp Cys Tyr Tyr Met Ala Thr Gin Lys Arg 
2610 2615 2620 

Val Gin Glu Val Arg Gly Tyr Thr Lys Gly Gly Pro Gly His Glu Glu 
625 2630 2635 2640 



2823218 

26 

Pro Gin Leu Val Gin Ser Tyr Gly Trp Asn lie Val Thr Met Lys Ser 
2645 2650 2655 

Gly Val Asp Val Phe Tyr Arg Pro Ser Glu Cys • Cys Asp Thr Leu Leu 
2660 2665 ' ' 2670 

Cys Asp lie Gly Glu Ser Ser Ser Ser Ala Glu Val Glu Glu His Arg 
2675 2680 2685 

Thr He Arg Val Leu Glu Met Val Glu Asp Trp Leu His Arg Gly Pro 
2690 2695 2700 

Arg Glu Phe Cys Val Lys Val Leu Cys Pro Tyr Met Pro Lys Val He 
705 2710 2715 2720 

Glu Lys Met Glu Leu Leu Gin Arg Arg Tyr Gly Gly Gly Leu Val Arg 
2725 2730 2735 

Asn Pro Leu Ser Arg Asn Ser Thr His Glu Met Tyr Trp Val Ser Arg 
2740 2745 2750 

Ala Ser Gly Asn Val Val His Ser Val Asn Met Thr Ser Gin Val Leu 
2755 2760 2765 

Leu Gly Arg Met Glu Lys Arg Thr Trp Lys. Gly Pro Gin Tyr Glu Glu 
2770 2775 2780 

Asp Val Asn Leu Gly Ser Gly Thr Arg Ala Val Gly Lys Pro Leu Leu 
785 2790 2795 2800 

Asn Ser Asp Thr Ser Lys He Asn Asn Arg He Glu Arg Leu Arg Arg 
2805 2810 ~ 2815 

Glu Tyr Ser Ser Thr Trp His His Asp Glu Asn His Pro Tyr Arg Thr 
2820 2825 2830 

Trp Asn Tyr His Gly Ser Tyr Asp Val Lys Pro Thr Gly Ser Ala Ser 
2835 2840 2845 

Ser Leu Val Asn Gly Val Val Arg Leu Leu Ser Lys Pro Trp Asp Thr 
2850 2855 2860 

He Thr Asn Val Thr Thr Met Ala Met Thr Asp Thr Thr Pro Phe Gly 
865 2870 2875 2880 

Gin Gin Arg Val Phe Lys Glu Lys Val Asp Thr Lys Ala Pro Glu Pro 
2885 2890 2895 

Pro Glu Gly Ala Lys Tyr Val Leu Asn Glu Thr Thr Asn Trp Leu Trp 
2900 2905 2910 

Ala Phe Leu Ala Arg Glu Lys Arg Pro Arg Met Cys Ser Arg Glu Glu 
2915 2920 2925 

Phe He Arg Lys Val Asn Ser Asn Ala Ala Leu Gly Ala Met Phe Glu 
2930 2935 2940 
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Glu Gin Asn Gin Trp Arg Ser Ala Arg Glu Ala Val Glu Asp Pro Lys 
945 2950 2955 2960 

Phe Trp Glu Met Val Asp Glu Glu Arg Glu Ala His Leu Arg Gly Glu 
2965 2970 2975 

Cys His Thr Cys lie Tyr Asn Met Met Gly Lys Arg Glu Lys Lys Pro 
2980 2985 2990 

Gly Glu Phe Gly Lys Ala Lys Gly Ser Arg Ala lie Trp Phe Met Trp 
2995 3000 3005 

Leu Gly Ala Arg Phe Leu Glu Phe Glu Ala Leu Gly Phe Leu Asn Glu 
3010 3015 3020 

Asp His Trp Leu Gly Arg Lys Asn Ser Gly Gly Gly Val Glu Gly Leu 
025 3030 3035 3040 

Gly Leu Gin Lys Leu Gly Tyr He Leu Arg Glu Val Gly Thr Arg Pro 
3045 3050 3055 

Gly Gly Lys He Tyr Ala Asp Asp Thr Ala Gly Trp Asp Thr Arg He 
3060 3065 3070 

Thr Arg Ala Asp Leu Glu Asn Glu Ala Lys Val Leu Glu Leu Leu Asp 
3075 3080 3085 

Gly Glu His Arg Arg Leu Ala Arg Ala He He Glu Leu Thr Tyr Arg 
3090 3095 3100 

His Lys Val Val Lys Val Met Arg Pro Ala Ala Asp Gly Arg Thr Val 
105 3110 3115 3120 

Met Asp Val He Ser Arg Glu Asp Gin Arg Gly Ser Gly Gin Val Val 
3125 3130 ' 3135 

Thr Tyr Ala Leu Asn Thr Phe Thr Asn Leu Ala Val Gin Leu Val Arg 
3140 3145 3150 

Met Met Glu Gly Glu Gly Val He Gly Pro Asp Asp Val Glu Lys Leu 
3155 3160 ' 3165 

Thr Lys Gly Lys Gly Pro Lys Val Arg Thr Trp Leu Phe Glu Asn Gly 
3170 3175 3180 

Glu Glu Arg Leu Ser Arg Met Ala Val Ser Gly Asp Asp Cys Val Val 
185 3190 3195 " 3200 

Lys Pro Leu Asp Asp Arg Phe Ala Thr Ser Leu His Phe Leu Asn Ala 
3205 3210 3215 

Met Ser Lys Val Arg Lys Asp He Gin Glu Trp Lys Pro Ser Thr Gly 
3220 3225 3230 

Trp Tyr Asp Trp Gin Gin Val Pro Phe Cys Ser Asn His Phe Thr Glu 
3235 3240 3245 
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Leu lie Met Lys Asp Gly Arg Thr Leu Val Val Pro Cys Arg Gly Gin 
3250 3255 3260 

Asp Glu Leu Val Gly Arg Ala Arg He Ser Pro Gly Ala Gly Trp Asn 
265 3270 3275 ' 3280 

Val Arg Asp Thr Ala Cys Leu Ala Lys Ser Tyr Ala Gin Met Trp Leu 
3285 3290 3295 

Leu Leu Tyr Phe His Arg Arg Asp Leu Arg Leu Met Ala Asn Ala He 
3300 3305 3310 

Cys Ser Ala Val Pro Val Asn Trp Val Pro Thr Gly Arg Thr Thr Trp 
3315 3320 3325 

Ser He His Ala Gly Gly Glu Trp Met Thr Thr Glu Asp Met Leu Glu 
3330 3335 3340 

Val Trp Asn Arg Val Trp He Glu Glu Asn Glu Trp Met Glu Asp Lys 
345 3350 3355 3360 

Thr Pro Val Glu Lys Trp Ser Asp Val Pro Tyr Ser Gly Lys Arg Glu 
3365 3370 3375 

Asp He Trp Cys Gly Ser Leu He Gly Thr Arg Ala Arg Ala Thr Trp 
3380 3385 3390 

Ala Glu Asn He Gin Val Ala He Asn Gin Val Arg Ala He He Gly 
3395 3400 3405 

Asp Glu Lys Tyr Val Asp Tyr Met Ser Ser Leu Lys Arg Tyr Glu Asp 
3410 3415 3420 

Thr Thr Leu Val Glu Asp Thr Val Leu 
425 3430 



<210> 3 
<211> 37 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Description de la sequence artificielle : AMORCE 
OLIGONUCLEOTIDIQUE 

<400> 3 

tagcacgaag aattcgatgt ctaagaaacc aggaggg 37 



<210> 4 

<211> 50 

<212> ADN 

<213> Sequence artificielle 
<220> 
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<223> Description de la sequence artif icielle : AMORCE 
OLIGONUCLEOTIDIQUE 



<400> 4 

aagttagccc gggttaatgc tcctacgctg gcgatcaggc caatcaggac 
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